LightRAG - 更快更便宜的GraphRAG

techlead_krischang發表於2024-11-27

原文網址 : https://www.cnblogs.com/xfuture/p/18572320

檢索增強生成（Retrieval-Augmented Generation, RAG）已經成為提升大型語言模型（LLMs）能力的重要方法之一，透過整合外部知識，顯著改善了生成內容的質量和相關性。

RAG 的侷限性

傳統的 RAG 系統雖然表現優異，但其侷限性也不容忽視：

資料結構扁平化
傳統 RAG 系統往往依賴扁平化的資料結構，難以捕捉資訊之間的複雜關係。這種缺陷導致生成的答案片段化，缺乏上下文的一致性。
有限的上下文意識
系統在處理需要綜合多個資料點的複雜問題時表現不佳，生成的答案缺乏對資料間相互關聯的全面理解。

GraphRAG的侷限性

GraphRAG 透過使用** 知識圖譜** 對文字中的實體和關係進行結構化建模，從而能夠捕捉資訊間的複雜關聯。GraphRAG 首先在整個私有資料集上建立實體和關係的引用，隨後採用自底向上的聚類方法，將資料層次化地組織為語義簇。
然而，當資料集中加入新的知識時，GraphRAG 必須重新執行整個圖構建流程。這種方式對於動態更新的資料集來說效率低下且成本高昂。

資源需求高：需要大量 API 呼叫（通常依賴昂貴的模型如 GPT-4o）。
資料更新昂貴：每次更新資料時，必須重建整個圖譜。

file

LightRAG的創新點

file

相比之下，LightRAG 的增量更新機制大大簡化了流程。它透過簡單的 聯合操作（union operation），將新的圖節點和邊直接新增到現有圖譜中。這種方式避免了重複構建圖譜的高昂開銷，同時確保知識庫實時更新，適應動態資料需求。
file

LightRAG

LightRAG 的核心賣點在於 基於圖的索引和雙層檢索框架。以下是對這兩個關鍵功能的深入解析：

Graph-based Indexing

file
以下是 LightRAG 進行基於圖索引的步驟：

實體與關係（ER）提取
實體與關係提取由圖中的 R(.) 表示。此步驟確保從給定文件中首先提取簡單的實體。例如，在上圖的示例中，“蜜蜂”（bees）和“養蜂人”（beekeeper）是兩個實體，它們透過“觀察”（observe）關係相關聯，即養蜂人觀察蜜蜂。
使用 LLM 生成鍵值（KV）對
使用簡單的 LLM 生成鍵值對。LLM 的分析步驟為實體或關係提供了簡要的說明或解釋。例如，在所選示例中，LLM 解釋了“養蜂人”是誰。此步驟在圖中由 P(.) 表示。需要注意的是，此 LLM 不同於主 RAG 流程中使用的通用 LLM。
去重
鑑於文件內容與蜜蜂相關，實體“養蜂人”可能從多個文件或文字塊中被多次提取。因此，需要一個去重步驟，僅保留一個具有相同含義的實體，丟棄其他重複項。此步驟在圖中由 D(.) 表示。

Dual-level Retrieval

file
對 RAG 系統的查詢可以分為兩種型別——具體的或抽象的。在同樣的蜜蜂示例中，具體查詢可能是：“一個蜂巢中可以有多少隻蜂王？” 抽象查詢可能是：“氣候變化對蜜蜂有哪些影響？” 為了應對這種多樣性，LightRAG 採用了兩種檢索方式：
file
低層檢索：簡單地提取精確的實體及其關係，如蜜蜂（bees）、觀察（observe）和養蜂人（beekeepers）。
高層檢索：透過使用 LLM，LightRAG 聚合資訊並總結多個資訊來源。

架構意義

進行這些操作並切換到 LightRAG 的確能改進執行時間。在索引過程中，每個文字塊只需呼叫一次 LLM 來提取實體及其關係。

同樣，在使用者查詢時，僅使用與索引相同的 LLM 從文字塊中檢索實體和關係。這大大減少了檢索的開銷，從而降低了計算成本。因此，最終擁有了一個“輕量”的 RAG！

將新知識整合到現有圖譜中看起來是一個無縫的操作。與其在有新資訊時重新索引整個資料，可以簡單地將新知識附加到現有圖譜中。

評估

評估中，LightRAG 與 Naive RAG、RQ-RAG、HyDE 和 GraphRAG 進行了比較。為了保持比較的公平性，統一使用了 GPT-4o-mini 作為 LLM，並在所有資料集上採用固定的分塊大小（1200）。答案的評估標準包括全面性、多樣性以及回答使用者問題的有效性。

file

正如下劃線結果所示，LightRAG 超越了當前所有最先進的方法。

總體而言，得出了以下結論：
• 使用基於圖的方法（如 GraphRAG 或 LightRAG）相比基礎的 Naive RAG 有顯著改進。
• LightRAG 透過雙層檢索正規化生成了相當多樣化的答案。
• LightRAG 能夠更好地處理複雜查詢。

結論

儘管 RAG 是一種相對較新的技術，但這一領域正在快速發展。像 LightRAG 這樣的技術可以將 RAG 流程引入廉價的通用硬體，這是非常受歡迎的。儘管硬體領域不斷進步，但始終需要在計算受限的硬體上實時執行 LLM 和 RAG 流程。

本文由部落格一文多發平臺 OpenWrite 釋出！

LLM論文研讀: GraphRAG的替代者LightRAG
2024-10-30
劍指immer，更快更強的limu
2024-02-26
愛立信：更智慧、更快速、更安全的“員工”的崛起
2023-01-23
更快更穩定：這就是Wasserstein GAN
2018-11-20
GraphRAG介紹
2024-07-24
Python 3.8新功能盤點：更快，更簡潔，更一致，更現代化
2019-06-22
Python
更難、更好、更快、更強：LLM Leaderboard v2 現已釋出
2024-06-27
Min瀏覽器: 更快更輕量瀏覽器
2018-11-04
瀏覽器
免費API介面：讓開發更簡單更快
2024-01-10
API
人工智慧如何使城市更快更適合居住
2019-06-24
人工智慧
世界銀行報告：邁向更快、更清潔的增長
2023-10-19
Optimum + ONNX Runtime: 更容易、更快地訓練你的 Hugging Face 模型
2023-03-03
Hugging Face模型
更準更快的YOLOv6來了，美團出品並開源
2022-06-26
YOLO
金山衛士1.0Beta釋出更小更快更安全
2019-05-14
海量資料分析更快、更穩、更準。GaussDB(for MySQL) HTAP只讀分析特性詳解
2022-03-23
MySql
更大更快更cool更「嚇人」，主打「遊戲上分」功能的 Note10 會「嚇」到你嗎？
2018-07-31
遊戲
4種更快更簡單實現Python資料視覺化的方法
2018-12-04
Python視覺化
最新notejs編寫商城原始碼。比php更快，更流暢
2019-05-11
JS原始碼PHP
更省更快，如何使用 Serverless 搭建個人專屬網盤？
2022-06-07
Server
這樣進行進位制轉換更快更清晰哦！
2021-05-07
GraphRAG 檢索增強+圖模型
2024-09-02
模型
更快更省：帶有新AOT引擎的Spring Native 0.11 釋出 - spring.io
2021-12-10
Spring
打造屬於機器人的觸覺感官，騰訊Robotics X實驗室做到了更快、更輕、更準
2022-12-01
機器人
更小、更快、更簡單Google ProtoBuf 跨語言通訊協議
2019-03-04
Go協議
“東數西算” 讓數字化“腳步”更快更穩TC
2022-03-17
調查發現：如果老闆更專業，員工更快樂
2021-03-27
更快更準的未來治療，AI在這5個方面交出滿意答卷
2019-09-02
AI
從Densebox到Dubox：更快、效能更優、更易部署的anchor-free目標檢測
2019-05-15
Grafana 系列文章（十一）：Loki 中的標籤如何使日誌查詢更快更方便
2023-02-08
GrafanaLoki
時隔6年，谷歌BERT終於有替代品了！更快更準更長，還不炒作GenAI
2025-01-05
谷歌AI
Sealos 雲主機正式上線，便宜，便宜，便宜！
2024-04-26
基於SiliconCloud快速體驗GraphRag.Net
2024-08-08
Cloud
英特爾AI生態兩大利器，讓AI開發更快更簡單
2018-11-30
AI
CPNDet：粗暴地給CenterNet加入two-stage精調，更快更強 | ECCV 2020
2021-01-18
Facebook開源Mask R-CNN的PyTorch 1.0基準，比mmdetection更快、更省記憶體
2018-10-25
CNNPyTorch記憶體
更快更簡單——當我為發票報銷抓狂的時候，Zoho Expense出現了
2020-08-18
更快的Maven來了
2021-12-25
Maven
好喝便宜的茶葉，哪裡茶葉批發便宜
2021-01-24

LightRAG - 更快更便宜的GraphRAG

RAG 的侷限性

GraphRAG的侷限性

LightRAG的創新點

LightRAG

Graph-based Indexing

Dual-level Retrieval

架構意義

評估

結論

相關文章