向量動態量化

DashVector發表於2024-11-14

原文網址 : https://www.cnblogs.com/DashVector/p/18545647

本文介紹向量檢索服務DashVector動態量化功能和作用。

背景介紹

量化（Quantization）是向量檢索技術中一種常用的最佳化方法，透過一定程度的精度（召回率）損失，來換取效能的大幅度提升，以及記憶體佔用（索引檔案大小）大幅度降低。

向量檢索服務DashVector支援向量的動態量化，使用者僅需在新建Collection時選擇對應的量化策略，即可無感的使用量化功能。

重要

量化功能 侷限性 說明：現階段，開啟量化功能的Collection無法使用Sparse Vector功能。若您有量化+SparseVector結合使用的需求，可加群（官方釘釘群：25130022704）聯絡我們。

開啟動態量化

前提條件

已建立Cluster
已獲得API-KEY
已安裝最新版SDK

程式碼示例

說明

需要使用您的api-key替換示例中的YOUR_API_KEY、您的Cluster Endpoint替換示例中的YOUR_CLUSTER_ENDPOINT，程式碼才能正常執行。
Cluster Endpoint，可在控制檯"Cluster詳情"中檢視。

import dashvector
import numpy as np
from dashvector import VectorParam

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
assert client

# 建立帶有量化策略的collection
ret = client.create('quantize_demo', 
                     vectors=VectorParam(768, quantize_type='DT_VECTOR_INT8'))
print(ret)

collection = client.get('quantize_demo')

# 正常寫入向量資料，該向量資料會按照建立collection時定義的量化策略自動進行量化
collection.insert(('1', np.random.rand(768).astype('float32')))

# 透過id獲取對應的doc，需注意，這裡獲取到的向量資料是經過反量化後的近似值，非插入時的原值
doc = collection.fetch('1')

# 若檢索時設定返回向量資料，返回的向量資料同樣是經過反量化後的近似值，非插入時的原值
docs = collection.query(
    vector=np.random.rand(768).astype('float32'),
    include_vector=True
)

說明

透過獲取Doc獲取到的向量資料，是經過反量化後的近似值，非插入時的原值。

引數描述

建立Collection時可透過VectorParam類的quantize_type欄位來定義量化策略。quantize_type當前可選值如下：

DT_VECTOR_INT8：將Float32向量量化為INT8型別

效能和召回率參考

基於1百萬768維資料集

DashVector規格 ：P.large
度量方式 ：cosine
topk ：100

說明

可以看到這個示例中，以4.38%的召回率下降為代價，將索引大小縮減為原來的1/3，同時QPS提升了48%。
以上資料為基於Cohere資料集實測結果，但不同資料集的資料分佈對QPS、召回以及壓縮比有影響，上述資料僅供參考。

更多參考

重要
可以看到，DashVector量化策略並非適用於所有資料集。在實際生產環境中，請謹慎使用量化策略。

建議建立不帶量化策略、帶量化策略的兩個Collection，經過實際對比、測試、驗證後再確定是否可將量化策略用於生產環境。

PG 向量化引擎
2022-01-29
PG 向量化引擎--2
2022-01-29
向量化程式碼實踐與思考：如何藉助向量化技術給程式碼提速
2023-12-27
文字向量化模型acge_text_embedding
2024-05-08
模型
Numpy學習（2）numpy向量化、numpy操作
2020-10-13
大規模向量檢索與量化方法
2024-11-18
“初雪”與“向量化”| StarRocks Hacker Meetup小記
2021-11-10
詳解數倉的向量化執行引擎
2024-04-25
Vector Magic for Mac/win，圖片向量化的神器！
2024-01-02
Mac
文字資料分析——主題提取+詞向量化
2020-10-20
資料庫向量化入門與實現
2022-11-24
資料庫
三相電合成旋轉向量-動態圖
2024-11-10
推薦兩篇有關 Rust 自動向量化編譯技術的文章
2020-06-10
Rust編譯
向量化操作是 Pandas 的一個強大特性
2024-08-22
資料庫-SQL_duckdb向量化計算-vector
2024-07-15
資料庫SQL
提速 Spark SQL 2 倍，GLUTEN 向量化引擎原理剖析
2023-03-30
SparkSQL
向量化實現矩陣運算最佳化(一)
2023-09-28
矩陣
向量化引擎對HTAP的價值與技術思考
2022-07-21
ClickHouse原始碼筆記3:函式呼叫的向量化實現
2021-02-22
原始碼筆記函式
Andrew NG 深度學習課程筆記：梯度下降與向量化操作
2019-02-23
深度學習筆記梯度
fastText，智慧與美貌並重的文字分類及向量化工具
2018-07-05
AST文字分類
幾何圖形構成的向量化極簡風格美術
2019-12-05
dotnet 簡單控制檯使用 KernelMemory 向量化文字嵌入生成和查詢
2024-06-16
Zilliz @ QCon：萬物皆可向量化—— Milvus 的現狀與未來
2023-02-21
軟體優化的原理與實踐系列之一向量化計算
2018-09-20
優化
高效能運算-bgra2rgb轉換-向量化最佳化(15)
2024-11-30
word2vec實現域名向量化並計算相似度-python程式碼
2021-09-02
Python
「分散式技術專題」兩種向量化執行引擎的實現方法
2023-02-13
分散式
源中瑞量化交易軟體_量化自動交易平臺
2019-01-22
輕量化web組態編輯器外掛
2024-03-30
Web
c++向量變數動作.
2020-12-03
C++變數
神經網路入門篇：詳解多樣本向量化（Vectorizing across multiple examples）
2023-11-13
神經網路ROS
TGDC | 一個遊戲程式設計師的堅持 —— 論向量化程式設計
2020-12-22
遊戲程式設計師
自動交易量化搬磚系統開發高頻量化搭建
2020-01-07
向量化執行引擎框架 Gluten 宣佈正式開源，並亮相 Spark 技術峰會
2022-11-24
框架Spark
演算法金 | 推導式、生成器、向量化、map、filter、reduce、itertools，再見 for 迴圈
2024-07-07
演算法Filter
Android動畫：行雲流水的向量圖示動畫
2018-10-23
Android動畫
DNS Tunnel隧道隱蔽通訊實驗 && 嘗試復現特徵向量化思維方式檢測
2018-04-03
DNS特徵