文字轉換為向量有多種方式:
方法一:
(推薦)方法二:
方法三:
方法四:
本文介紹方法三:如何透過
將文字轉換為向量,併入庫至向量檢索服務DashVector中進行向量檢索。前提條件
-
DashVector:
-
已建立Cluster:
-
已獲得API-KEY:
-
已安裝最新版SDK:
-
-
Jina AI
-
已獲得API金鑰:
-
Jina Embeddings v2模型
簡介
Jina Embeddings v2模型,唯一支援 8192 個詞元長度的開源向量模型,在大規模文字向量化基準 (MTEB) 的功能和效能方面與 OpenAI 的閉源模型 text-embedding-ada-002 相當。
模型名稱 |
向量維度 |
度量方式 |
向量資料型別 |
備註 |
jina-embeddings-v2-small-en |
512 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-en |
768 |
Cosine |
Float32 |
|
jina-embeddings-v2-base-zh |
768 |
Cosine |
Float32 |
|
說明
關於Jina Embeddings v2模型更多資訊請參考:
使用示例
說明
需要進行如下替換程式碼才能正常執行:
-
DashVector api-key替換示例中的{your-dashvector-api-key}
-
DashVector Cluster Endpoint替換示例中的{your-dashvector-cluster-endpoint}
-
Jina AI api-key替換示例中的{your-jina-api-key}
Python示例: