RAG 2.0架構詳解：構建端到端檢索增強生成系統

deephub發表於2024-04-19

原文網址 : https://www.cnblogs.com/deephub/p/18145557

關於檢索增強生成（RAG）的文章已經有很多了，如果我們能建立出可訓練的檢索器，或者說整個RAG可以像微調大型語言模型（LLM）那樣定製化的話，那肯定能夠獲得更好的結果。但是當前RAG的問題在於各個子模組之間並沒有完全協調，就像一個縫合怪一樣，雖然能夠工作但各部分並不和諧，所以我們這裡介紹RAG 2.0的概念來解決這個問題。

什麼是RAG？

簡單來說，RAG可以為我們的大型語言模型（LLM）提供額外的上下文，以生成更好、更具體的回應。LLM是在公開可用的資料上訓練的，它們本身是非常智慧的系統，但它們無法回答具體問題，因為它們缺乏回答這些問題的上下文。

所以RAG可以向LLM插入新知識或能力，儘管這種知識插入並不是永久的。而另一種常用向LLM新增新知識或能力的方法是透過對我們特定資料進行微調LLM。

透過微調新增新知識相當困難，昂貴，但是卻是永久性。透過微調新增新能力甚至會影響它以前擁有的知識。在微調過程中，我們無法控制哪些權重將被改變，因此也無法得知哪些能力會增加或減少。

選擇微調、RAG還是兩者的結合，完全取決於手頭的任務。沒有一種適合所有情況的方法。

RAG的經典步驟如下：

將文件分成均勻的塊。
每個塊是一段原始文字。
使用編碼器為每個塊生成嵌入（例如，OpenAI嵌入，sentence_transformer等），並將其儲存在資料庫中。
找到最相似的編碼塊，獲取這些塊的原始文字，並將其作為上下文與提示一起提供給生成器。

RAG 2.0

當今典型的RAG系統使用現成的凍結模型進行嵌入，使用向量資料庫進行檢索，以及使用黑盒語言模型進行生成，透過提示或編排框架將它們拼接在一起。各個元件技術上可行，但整體遠非最佳。這些系統脆弱，缺乏對其部署領域的任何機器學習或專業化，需要廣泛的提示，並且容易發生級聯錯誤。結果是RAG系統很少透過生產標準。

而我們要說的RAG 2.0的概念，透過預訓練、微調並對所有元件進行對齊，作為一個整體整合系統，透過語言模型和檢索器的雙重反向傳播來最大化效能：

https://avoid.overfit.cn/post/18853fc6f10e4e23a992880c624ea1dd

檢索增強生成(Retrieval-augmented Generation,RAG)實戰1-基於LlamaIndex構建第一個RAG應用
2024-03-02
AIIndex
如何在本地使用AI檢索增強生成（RAG）
2024-10-31
AI
SemanticKernel/C#：檢索增強生成(RAG)簡易實踐
2024-08-01
C#
RALLM 檢索增強LLM架構
2024-05-27
架構
25 個值得關注的檢索增強生成 (RAG) 模型和框架
2024-11-17
模型框架
檢索增強生成(RAG)實踐：基於LlamaIndex和Qwen1.5搭建智慧問答系統
2024-05-07
AIIndex
Magic-PDF：端到端PDF文件解析神器構建高質量RAG必備！
2024-07-31
在C#中基於Semantic Kernel的檢索增強生成（RAG）實踐
2024-10-19
C#
RAG實戰3-如何追蹤哪些文件片段被用於檢索增強生成
2024-03-07
TS版LangChain實戰：基於文件的增強檢索（RAG）
2023-11-28
LangChain
Graph RAG: 知識圖譜結合 LLM 的檢索增強
2023-10-11
構建RAG應用-day04-將LLM 接入 LangChain 構建檢索問答鏈部署知識庫助手
2024-04-25
LangChain
如何從零構建直播系統（後端篇）
2018-04-12
後端
解構流儲存 — Pravega，與 Flink 構建端到端的大資料流水處理線
2022-02-17
大資料
RAG：AI大模型聯合向量資料庫和 Llama-index，助力檢索增強生成技術
2024-05-07
AI大模型資料庫Index
RAG系統架構介紹
2024-10-25
架構
應雲而生，一文看懂端到端的可觀測體系構建
2022-01-24
LightRAG: 港大黃超團隊打造簡單高效的RAG系統, 大幅降低大模型檢索增強成本
2024-10-14
大模型
如何為 5G 網路構建端到端的安全？
2021-06-28
端到端-架構收集整理
2024-08-20
架構
GraphRAG 檢索增強+圖模型
2024-09-02
模型
詳解邊緣計算系統邏輯架構：雲、邊、端協同
2022-05-11
架構
使用 Go 和 ReactJS 構建聊天系統（六）：Docker 化後端
2020-01-20
GoReactJSDocker後端
RAG新突破：塊狀注意力機制實現超低延遲檢索增強
2024-11-03
Signal如何使用Rust構建大規模端到端加密視訊通話？
2021-12-16
Rust加密
構建可承極端流量的軟體系統最佳實踐
2023-12-20
建構函式詳解
2021-09-09
函式
構建RAG應用-day05: 如何評估 LLM 應用評估並最佳化生成部分評估並最佳化檢索部分
2024-04-27
SpringBoot後端系統的基礎架構
2020-06-12
Spring Boot後端架構
使用 Go 和 ReactJS 構建聊天系統（四）：處理多個客戶端
2020-01-19
GoReactJS客戶端
LLM學習(四)——構建 RAG 應用
2024-04-24
文盤rust--使用 Rust 構建RAG
2024-10-08
Rust
使用 Rust、OpenAI 和 Qdrant 構建 Agentic RAG
2024-06-19
RustOpenAI
Java建構函式詳解
2020-11-17
Java函式
2022 re:Invent ：亞馬遜雲科技構建端到端的雲原生資料戰略
2023-01-05
亞馬遜
C++構建工具-構建系統
2024-10-16
C++
MQTT協議從服務端到客戶端詳解
2018-03-09
MQQT協議服務端客戶端
Android系統架構詳解(2)--Android Runtime
2018-11-12
Android架構

RAG 2.0架構詳解：構建端到端檢索增強生成系統

什麼是RAG？

RAG 2.0

相關文章