向量檢索服務產品規格

DashVector發表於2024-11-25

本文介紹向量檢索服務DashVector的產品規格,以幫助使用者選擇貼合自身業務場景的例項規格。

例項型別

向量檢索服務DashVector當前支援三種四種例項(Cluster)型別,以支援不同的業務場景和需求:

  • 效能型 :適用於查詢QPS高、查詢延遲低的場景,同時效能型也是寫入效率最高的例項型別。對於高併發、大流量、低延遲場景,或對寫入效率有較高的要求的場景,可選擇效能型例項。

  • 儲存型(推薦) :儲存型相對於效能型有5倍的儲存容量優勢,能夠儲存和管理更多的向量資料,適用於大規模資料量的場景。儲存型例項同樣也具備優秀的技術指標, 可滿足大部分場景需求 ,同時也是 價效比最高 的例項型別,推薦使用者選擇使用。

  • Serverless型: 不限資料容量,基於使用者資料自動擴縮,按實際請求收費,適用於低頻QPS查詢(QPS<2),延遲不敏感等場景。總體效能與儲存型例項接近。

  • 免費試用 :適用於測試、體驗場景, 請勿用於線上生產環境 。免費試用例項有效期為1個月,到期後可再次申請試用。免費例項有部分試用限制,詳情可參考約束與限制。

重要

免費試用例項有效期為1個月,到期後免費試用例項將自動釋放,例項中的資料將被全部刪除並清空且不可恢復,為了保證例項可持續使用,請您於建立免費試用例項之後的30個自然日內將免費試用例項升級為付費例項。免費試用例項由於到期且沒有升級為付費例項而導致的資料被刪除的情況,阿里雲將不承擔相關責任。

例項規格

向量檢索服務DashVector針對效能型和儲存型例項提供不同檔位的例項(Cluster)規格,不同規格的主要區別在於儲存容量的不同。Serverless例項與已有效能型和儲存型不同,無容量限制。

說明

若您有更高規格需求,或有任何反饋、期望獲取更多技術支援,歡迎透過如下方式聯絡我們:

  • 官方釘釘群:25130022704

  • 技術支援郵箱:dashvector@service.aliyun.com

儲存容量參考

重要

  1. 以上資料均已透過實際測試驗證,但僅供參考!

  2. 上述用於容量測試的 Doc中不包含任何Fields,僅包含主鍵和向量資料 ,主鍵為從零開始自增正整數轉字串。大部分實際生產場景中,Fields是不可或缺的,Fields資料同樣會佔用儲存空間,從而導致實際儲存的Doc數低於上述表格。

檢索效能參考

重要

  1. 以上資料為基於Cohere資料集實測結果,但由於不同資料集的資料分佈對效能有影響,上述資料僅供參考。

  2. 上述用於效能測試的 Doc中不包含任何Fields,僅包含主鍵和向量資料 ,主鍵為從零開始自增正整數轉字串。

  3. 向量檢索服務DashVector會定時在後臺進行向量索引最佳化,通常在寫入完成後4小時完成,屆時效能達到最優狀態。

  4. 不同規格在寫滿資料情況下,QPS與上述表格中保持一致或更高,不因資料量的增加而下降。如,P.2xlarge規格,在寫滿2百萬768維FP32向量資料情況下,topk=100的QPS可達到600+。

副本數

向量檢索服務DashVector支援調整副本數,可選範圍為1-5。副本之間資料完全相同,副本數越大,可支援的QPS越高,呈線性關係。同時副本數越大,服務可用性越高, 建議對可用性有較高要求的生產環境選擇>=2的副本數 。{#4d1b3cb1c1c9m}
說明

  • 需要注意,副本數的增加和減少不會影響儲存容量,僅影響QPS和可用性。

  • Serverless例項無副本概念,由系統管理。

相關文章