RAG應用開發實戰02-相似性檢索的關鍵 - Embedding

公众号-JavaEdge發表於2024-04-14

原文網址 : https://www.cnblogs.com/JavaEdge/p/18134415

1 文字Embedding

將整個文字轉化為實數向量的技術。

Embedding優點是可將離散的詞語或句子轉化為連續的向量，就可用數學方法來處理詞語或句子，捕捉到文字的語義資訊，文字和文字的關係資訊。

◉ 優質的Embedding通常會讓語義相似的文字在空間中彼此接*

◉ 優質的Embedding相似的語義關係可以透過向量的算術運算來表示：

2 文字Embedding模型的演進與選型

目前的向量模型從單純的基於 NLI 資料集（對稱資料集）發展到基於混合資料（對稱+非對稱）進行訓練，即可以做 QQ召回任務也能夠做 QD 召回任務，透過新增 Instruction 來區分這兩類任務，只有在進行 QD 召回的時候，需要對使用者 query 新增上 Instruction 字首。

3 VDB通用Embedding模型

模型選擇：

GPU資源：

4 VDB垂類Embedding模型

使用者提供垂類文件資料，VDB對模型進行微調，助力垂類應用效果更進一步。

最佳化1：對比學*拉*同義文字的距離，推遠不同文字的距離

最佳化2：短文字匹配和長文字匹配使用不同prompt，提升非對稱類文字效果

最佳化3：預訓練階段提升基座模型面向檢索的能力，對比學*階段提高負樣本數

5 儲存、檢索向量資料

5.1 為啥需要一個專用的向量資料庫

查詢方式與傳統資料庫存在區別
簡單易用，無需關心細節
為相似性檢索設計，天生效能優勢

5.2 騰訊雲向量資料庫的優勢

“首家”：

透過信通院的標準化效能和規模測試
支援千億級向量規模和最高500W QPS

自研：

核心源自集團自研OLAMA引擎
內部已有40+業務接入

價效比：

效能領先業內平均水平1.5倍
同時客戶成本降低20%

6 VDB優勢

流程簡化

模型簡化：

共享GPU叢集：

7 騰訊雲向量資料庫：消除大模型幻覺，加速大模型在企業落地

7.1 端到端AI套件，AGI時代的知識庫解決方案

提供一站式知識檢索方案，實現業界內最高召回率、大幅降低開發門檻，幫助企業快速搭建RAG應用，解決大模型幻覺問題。

7.2 源自集團多年積累，產品能力行業領先

源自騰訊自研向量檢索引擎OLAMA，集團內部40+業務線上使用，日均處理1600億次檢索請求。

『首家』透過中國信通院向量資料庫標準測試
單索引支援最高千億級超大資料規模
單例項最高可達500萬 QPS

本文由部落格一文多發平臺 OpenWrite 釋出！

RAG應用開發實戰(01)-RAG應用框架和解析器
2024-04-11
框架
檢索增強生成(Retrieval-augmented Generation,RAG)實戰1-基於LlamaIndex構建第一個RAG應用
2024-03-02
AIIndex
TS版LangChain實戰：基於文件的增強檢索（RAG）
2023-11-28
LangChain
RAG實戰3-如何追蹤哪些文件片段被用於檢索增強生成
2024-03-07
關鍵詞感知檢索
2024-11-14
構建RAG應用-day03: Chroma入門本地embedding 智譜embedding
2024-04-23
25 個值得關注的檢索增強生成 (RAG) 模型和框架
2024-11-17
模型框架
Mysql 如何實現全文檢索，關鍵詞跑分
2020-08-25
MySql
【高階RAG技巧】使用二階段檢索器平衡檢索的效率和精度
2024-04-26
SemanticKernel/C#：檢索增強生成(RAG)簡易實踐
2024-08-01
C#
AI Agent實戰：智慧檢索在Kingbase資料庫管理中的優勢應用
2024-07-01
AI資料庫
iOS中一種字串關鍵字檢索高亮的簡易實現
2019-02-27
iOS字串
RAG應用
2024-11-24
在C#中基於Semantic Kernel的檢索增強生成（RAG）實踐
2024-10-19
C#
如何在本地使用AI檢索增強生成（RAG）
2024-10-31
AI
Cognita: 開源RAG框架助力生產級應用開發
2024-10-12
框架
IDEA開發Spark應用實戰(Scala)
2022-08-21
IdeaSpark
RAG實戰4-RAG過程中發生了什麼？
2024-03-09
夸克APP端智慧：文件關鍵點檢測實踐與應用
2021-09-27
APP
Graph RAG: 知識圖譜結合 LLM 的檢索增強
2023-10-11
Embedding技術與應用(3)：Embeddings技術的實踐應用
2023-11-08
實戰指南 | Serverless 架構下的應用開發
2022-11-09
Server架構
Kurento實戰之四：應用開發指南
2021-08-23
基於ElasticSearch實現商品的全文檢索檢索
2018-04-15
Elasticsearch
Embedding技術與應用(4): Embedding應用工程探析
2023-11-20
Oracle開發：構建強大企業級應用的關鍵
2023-05-04
Oracle
ElasticSearch 億級資料檢索案例實戰
2019-12-06
Elasticsearch
RAG應用評估
2024-11-24
Embedding在騰訊應用寶的推薦實踐
2020-08-20
ArkTS 中的 XML 解析與生成：應用開發實戰
2024-10-29
XML
構建RAG應用-day04-將LLM 接入 LangChain 構建檢索問答鏈部署知識庫助手
2024-04-25
LangChain
純鍵盤開發實戰（MouselessProgramming）
2018-05-10
RAG應用效能最佳化全景圖：從查詢到生成的6個關鍵階段
2024-11-12
HarmonyOS NEXT應用開發實戰—元件堆疊
2024-04-23
元件
《Flask Web開發基於Python的Web應用開發實戰》簡評
2019-09-15
FlaskWebPython
影音娛樂應用開發，這些關鍵詞請查收
2022-06-24
構建RAG應用-day05: 如何評估 LLM 應用評估並最佳化生成部分評估並最佳化檢索部分
2024-04-27
RAG新突破：塊狀注意力機制實現超低延遲檢索增強
2024-11-03