表格增強生成TAG登場：解鎖AI自然語言與資料庫的完美結合

机器之心發表於2024-09-10

原文網址 : https://www.jiqizhixin.com/articles/2024-09-10-3

AI資料庫

與 Text2SQL 或 RAG 不同，TAG 充分利用了資料庫系統和 LLM 的功能。

人工智慧已經改變了人們的工作方式和與資料互動的方式。回想幾年前，研究人員必須編寫 SQL 查詢和程式碼才能從大量資料中提取有用資訊。如今，他們只需輸入問題，由語言模型驅動的底層系統會完成其餘工作，讓使用者只需與資料對話即可立即獲得答案。

這些新系統向資料庫提供自然語言互動，這種轉變取得了豐碩成果，但仍存在一些問題。從本質上講，這些系統仍然無法處理各種查詢。

本文，來自 UC 伯克利和史丹佛大學的研究人員現在正努力用一種名為表格增強生成 (TAG，Table-Augmented Generation) 的新方法來解決這一問題。

論文地址：https://arxiv.org/pdf/2408.14717
專案地址：https://github.com/TAG-Research/TAG-Bench
論文標題：Text2SQL is Not Enough: Unifying AI and Databases with TAG

TAG 是一種統一且通用的正規化，用於回答資料庫中的自然語言問題。TAG 模型代表了 LM 和資料庫之間未曾探索過的廣泛互動。

TAG 是如何工作的

目前，當使用者對自定義資料來源提出自然語言問題時，主要採用兩種方法：文字到 SQL 或檢索增強生成 (RAG)。

雖然這兩種方法都能很好地完成工作，但當問題變得複雜並超出系統能力時，使用者就會遇到問題。

舉例來說，文字到 SQL 的方法（這是一種將文字提示轉換為資料庫可以執行的 SQL 查詢）僅關注可以用關係代數表達的自然語言問題，但只能查詢使用者可能想要詢問的一小部分問題。

相似的，RAG 只能透過對資料庫中的一個或幾個資料記錄的點查詢來回答相關的查詢。這種方法專注於直接從資料庫中檢索特定資訊點，而不涉及更復雜的資料處理或分析。

然而，對於商業使用者來說，他們的問題通常需要複雜的領域知識、世界知識、精確計算和語義推理的組合。

為了解決這一問題，該研究提出了 TAG 系統，其實現主要包含三個步驟：查詢合成、查詢執行和答案生成。

TAG 模型很簡單，但功能強大，由以下三個方程定義：

值得注意的是，TAG 模型統一了之前的方法，包括 Text2SQL 和 RAG，它們僅代表了 TAG 的特殊情況並且僅能解決有限的使用者問題子集。

查詢合成

首先，LM 推斷哪些資料與回答問題相關，並將輸入轉換為該資料庫的可執行查詢（不僅僅是 SQL）。

其中，syn 函式接受自然語言請求 𝑅 並生成要由資料庫系統執行的查詢 𝑄。對於給定的使用者請求，此步驟負責 (a) 推斷哪些資料與回答請求相關，以及 (b) 執行語義解析以將使用者請求轉換為可由資料庫系統執行的查詢。此查詢可以使用任何查詢語言。論文示例中使用了 SQL。

如圖 1 所示，該查詢的問題是「總結票房最高的被認為是經典的愛情電影的評論」。在這裡，資料來源包含有關每部電影的名字、收入、型別和相關評論的資訊。在此步驟中，系統利用 LM 的語義推理能力來生成 SQL 查詢，該查詢使用來自資料來源的電影標題、評論、收入和型別的屬性。

查詢執行

在查詢執行階段，exec 函式在資料庫系統中執行查詢𝑄，獲取表𝑇。此步驟利用資料庫查詢引擎對大量儲存的資料進行有效地查詢。

如圖 1 所示，資料庫查詢是用 SQL 編寫的 selection 和 ranking 查詢，它返回包含相關行的表。查詢使用 LM 執行選擇，根據電影名字評估哪些電影是經典電影，並使用標準型別過濾器查詢愛情電影。查詢還根據收入對結果進行排名，以查詢票房最高的電影。如圖所示，結果表包含電影泰坦尼克號的評論。

答案生成

在這一步中，gen 函式使用 LM 生成使用者自然語言請求 R 的答案 A。

還是以圖 1 為例，在 TAG pipeline 最後階段，輸出有關泰坦尼克號的評論摘要作為對原始使用者請求的回答。在示例中，相關資料 𝑇 被編碼為字串，供模型處理。編碼表與原始使用者請求 𝑅 一起傳遞給 LM。為了獲得答案，此步驟利用模型對評論列的語義推理能力來總結評論。

實驗及結果

表 1 顯示了每種方法的精確匹配準確率和執行時間。如表所示，在選定的 BIRD （一個資料集，用於測試 LMs 的文字到 sql 的能力）查詢型別中，研究者發現手寫 TAG（hand-written TAG）基線始終能達到 40% 或更高的精確匹配準確率，而其他基線的準確率均未超過 20%。

具體而言，Text2SQL 在所有基線上的表現都不佳，執行準確率不超過 20%，但在 Ranking 查詢上的表現尤其糟糕，準確率只有 10%，因為許多 Ranking 查詢需要對文字進行推理。Text2SQL + LM 在各個基線上的表現都同樣糟糕，但在基於匹配和比較的查詢上表現更差，準確率只有 10%。

對於 RAG，可以看到它在所有查詢型別中都不能正確回答單個查詢，這表明 RAG 不適合這個領域的查詢。

手寫 TAG 總體上正確回答了 55% 的查詢，在比較查詢中表現最佳，精確匹配準確率為 65%。由於精確排序商品的難度較高，該基線在所有查詢型別（排名查詢除外）中的表現始終良好，準確率超過 50%。總體而言，與標準基線相比，此方法的準確率提高了 20% 至 65%。

表 2 表明，由於省略了答案生成步驟，vanilla Text2SQL 在需要 LM 推理的查詢上表現較差，精確匹配準確率為 10%。與此同時，RAG 基線和 Retrieval + LM Rank 基線在所有查詢型別上都表現不好，只能正確回答一個查詢。相比之下，手寫 TAG 基線在需要知識的查詢和需要推理的查詢上都實現了超過 50% 的準確率。

值得注意的是，除了提供卓越的準確率外，手寫 TAG 方法還提供了高效的實現，與其他基線相比，執行時間少用了 1/3。手寫基線對所有查詢的平均耗時為 2.94 秒。

最後，該研究定性分析了每個基線在聚合查詢上的結果。圖 2 為一個示例展示，查詢的內容為「提供有關雪邦國際賽車場的比賽資料」。

結果顯示，RAG 基線只能提供有關部分比賽的資訊，因為大多數相關比賽都無法被檢索到。另一方面，Text2SQL + LM 基線無法利用 DBMS 中的任何資訊，僅依賴於引數知識並且不提供進一步的分析。

相比較來說，手寫基線提供了 1999 年至 2017 年在雪邦國際賽道舉行的所有比賽的詳盡摘要。

^{參考連結：}

^{https://venturebeat.com/data-infrastructure/table-augmented-generation-shows-promise-for-complex-dataset-querying-outperforms-text-to-sql/}

生成表格與合併表格
2024-10-29
人工智慧與大資料的完美結合
2018-06-04
人工智慧大資料
DataGPT：一個用自然語言來分析資料的AI Agent
2024-11-15
GPTAI
RAG：AI大模型聯合向量資料庫和 Llama-index，助力檢索增強生成技術
2024-05-07
AI大模型資料庫Index
易語言連結資料庫
2024-04-05
資料庫
C語言資料結構：雙向連結串列的增刪操作
2024-04-23
C語言資料結構
自然語言處理背後的資料科學
2019-04-29
自然語言處理資料科學
自然語言處理的基本概念--結合spacy軟體的學習
2021-01-02
自然語言處理
資料庫中的共享鎖與排他鎖
2019-08-07
資料庫
解鎖你的資料庫：JPA和Hibernate的樂觀鎖與悲觀鎖
2024-05-21
資料庫
探索自然語言處理：語言模型的發展與應用
2024-03-13
自然語言處理模型
NLA自然語言分析，讓資料分析更智慧！
2022-06-02
MySQL的index merge(索引合併）導致資料庫死鎖分析與解決方案
2023-10-13
MySqlIndex索引資料庫
2018年最強自然語言模型 Google BERT 資源彙總
2019-03-03
模型Go
大語言模型與資料庫故障診斷
2023-02-28
模型資料庫
QT繪圖模組與資料庫的結合
2024-09-20
QT繪圖資料庫
pm2與go的完美結合
2018-07-09
Go
StartDT AI Lab | 資料增強技術如何實現場景落地與業務增值？
2019-12-19
AI
關於資料庫鎖的總結
2020-11-24
資料庫
C語言資料結構：雙向迴圈連結串列的增刪操作
2024-04-25
C語言資料結構
C語言資料結構：單向迴圈連結串列的增刪操作
2024-04-24
C語言資料結構
MIGO 增強提交資料庫後
2024-04-16
Go資料庫
資料庫操作語言DDL
2024-06-10
資料庫
影片場景下的自然語言處理應用
2018-10-19
自然語言處理
自然語言處理（NLP）系列（一）——自然語言理解（NLU）
2023-02-01
自然語言處理
自然語言處理與情緒智慧
2024-08-25
自然語言處理
重學C語言_資料結構與基礎語法
2020-11-11
C語言資料結構
更強的RAG：向量資料庫和知識圖譜的結合
2024-10-10
資料庫
Lingua：能準確檢測與辨識自然語言型別的Rust庫
2022-04-09
型別Rust
`Leaderf gtags`：模糊匹配與最強靜態符號索引工具的完美結合
2019-05-06
符號索引
MySQL資料庫-鎖詳解
2023-02-05
MySql資料庫
你已經是個成熟的表格了，該學會自然語言處理了
2018-10-24
自然語言處理
突破！自然語言強化學習(NLRL)：一個可處理語言反饋的強化學習框架
2024-12-07
強化學習框架
資料要素流通與隱私增強計算的結合實踐
2023-01-09
視訊場景下的自然語言處理應用
2018-10-19
自然語言處理
SQL資料庫操作語言DCL
2024-06-23
SQL資料庫
資料庫查詢語言（DQL）
2024-11-13
資料庫
【資料庫】優化SQL語言
2022-03-16
資料庫優化SQL

表格增強生成TAG登場：解鎖AI自然語言與資料庫的完美結合

相關文章