谷歌內部專案：大模型AI智慧體發現了程式碼漏洞

机器之心發表於2024-11-02

原文網址 : https://www.jiqizhixin.com/articles/2024-11-02-4

開源資料庫引擎 SQLite 有 bug，還是智慧體檢測出來的！

通常，軟體開發團隊會在軟體釋出之前發現軟體中的漏洞，讓攻擊者沒有破壞的餘地。模糊測試（Fuzzing）是一種常見的軟體測試方法，其核心思想是將自動或半自動生成的隨機資料輸入到一個程式中，並監視程式異常。

儘管模糊測試大有幫助，但有些漏洞難以甚至不可能透過模糊測試發現。

谷歌內部有一個名為 Project Zero 的軟體安全研究團隊，他們發現隨著大型語言模型 (LLM) 的程式碼理解和一般推理能力的提高，LLM 將能夠在識別和展示安全漏洞時重現人類安全研究人員的系統方法，最終彌補當前自動漏洞發現方法的一些盲點。

Project Zero 在 6 月介紹了 LLM 輔助漏洞研究框架 ——Naptime 架構，之後 Naptime 演變成了 Big Sleep 智慧體，由 Google Project Zero 和 Google DeepMind 合作完成。

^{Naptime 架構}

研究團隊認為：與開放式漏洞研究相比，變體分析任務更適合當前的 LLM。透過提供一個起點（例如之前修復的漏洞的詳細資訊），可以消除漏洞研究中的很多歧義：「這是一個以前的錯誤；某個地方可能還有另一個類似的錯誤。」

現在，Big Sleep 智慧體發現了第一個現實軟體漏洞：SQLite 中可利用堆疊緩衝區下溢。

研究團隊收集了 SQLite 儲存庫中最近的一些提交，手動刪除了瑣碎的和僅用於文件的更改，然後調整了 prompt，為智慧體提供提交訊息（commit message）和更改的差異，要求智慧體檢查當前儲存庫是否存在可能尚未修復的相關問題。

簡單來說，SQLite 這個漏洞是在索引型別欄位 iColumn 中使用了特殊的 sentinel 值 -1：

7476:   struct sqlite3_index_constraint {

7477:      int iColumn;              /* Column constrained.  -1 for ROWID */

7478:      unsigned char op;         /* Constraint operator */

7479:      unsigned char usable;     /* True if this constraint is usable */

7480:      int iTermOffset;          /* Used internally - xBestIndex should ignore */

7481:   } *aConstraint;            /* Table of WHERE clause constraints */

這建立了一個潛在的邊緣情況，而函式 seriesBestIndex 無法正確處理這種邊緣情況，導致在處理對 rowid 列有約束的查詢時，將負索引寫入堆疊緩衝區。在研究團隊提供給智慧體的構建中，啟用了除錯斷言（debug assertion），並且此條件由第 706 行的斷言檢查：

619 static int seriesBestIndex(
620   sqlite3_vtab *pVTab,

621   sqlite3_index_info *pIdxInfo

622 ){

...

630   int aIdx[7];           /* Constraints on start, stop, step, LIMIT, OFFSET,

631                          ** and value.  aIdx[5] covers value=, value>=, and

632                          ** value>,  aIdx[6] covers value<= and value< */

633   const struct sqlite3_index_constraint *pConstraint;

...

642   for(i=0; i<pIdxInfo->nConstraint; i++, pConstraint++){

643     int iCol;    /* 0 for start, 1 for stop, 2 for step */

644     int iMask;   /* bitmask for those column */

645     int op = pConstraint->op;

...

705     iCol = pConstraint->iColumn - SERIES_COLUMN_START;

706     assert( iCol>=0 && iCol<=2 );

707     iMask = 1 << iCol;

...

713     if( pConstraint->usable==0 ){

714       unusableMask |=  iMask;

715       continue;

716     }else if( op==SQLITE_INDEX_CONSTRAINT_EQ ){

717       idxNum |= iMask;

718       aIdx[iCol] = i;

719     }

720   }

然而，實際上這個斷言並不存在，因此該漏洞可能會被惡意利用。幸運的是，該團隊在正式版本出現之前就發現了這個問題，因此 SQLite 使用者沒有受到影響。

毫無疑問的是，智慧體在這次漏洞查詢中起了關鍵作用，這也表明智慧體在軟體安全方面具備很大的應用潛力。

^{參考連結：}

^{https://googleprojectzero.blogspot.com/2024/10/from-naptime-to-big-sleep.html}

五角大樓AI專案持續擴充套件，谷歌內部抗議愈演愈烈
2018-05-30
AI套件谷歌
AI大模型+低程式碼，在專案管理中的應用實踐
2023-04-25
AI大模型專案管理
CSS自適應佈局實現子元素專案整體居中/內部專案左對齊示例程式碼
2019-10-16
CSS
谷歌開源內部程式碼評審規範
2019-10-19
谷歌
人工智慧大模型之開源大語言模型彙總（國內外開源專案模型彙總）
2024-06-21
人工智慧大模型
AI現場發了2萬紅包，開啟了大模型Act時代
2024-11-29
AI大模型
當「軟體研發」遇上 AI 大模型
2024-04-30
AI大模型
又一屆「AI春晚」拉開序幕！智源大模型集體爆發了
2024-06-16
AI大模型
啃碎併發（10）：記憶體模型之內部原理
2019-02-26
記憶體模型
重磅：谷歌釋出最強大AI模型【Google Gemini】
2023-12-14
谷歌AI模型Go
Mistral AI兩連發：7B數學推理專用、Mamba2架構程式碼大模型
2024-07-17
AI架構大模型
蟻群、蜂群的智慧，大模型也可以有，谷歌等機構群體智慧研究亮相
2024-10-23
大模型谷歌
大模型開源專案
2024-11-24
大模型
今年的谷歌I/O大會超「硬」，還展示了下一代AI模型
2022-05-12
谷歌AI模型
基於大模型的智慧體徹底顛覆AI應用
2024-01-25
大模型智慧體AI
谷歌發現G Suite漏洞：部分密碼明文儲存長達十四年
2019-05-23
谷歌UI密碼
谷歌、哈佛研究人員開發新模型用AI預測一年內餘震
2018-08-30
谷歌模型AI
ChatGPT要慌了？谷歌推出最新AI大模型Gemma（可本地部署）
2024-03-02
ChatGPT谷歌AI大模型Gemma
獨家發現Chrome四大“高危”漏洞，360再獲谷歌官方致謝
2021-01-12
Chrome谷歌
Springboot --- 使用國內的 AI 大模型對話
2024-10-12
Spring BootAI大模型
【漏洞預警】WordPress檔案刪除功能引發程式碼執行漏洞
2018-06-28
專案管理的四大模型-迭代模型
2020-05-21
專案管理大模型
專案管理的四大模型-增量模型
2020-05-27
專案管理大模型
開源 | 谷歌內部工具Sandboxed API
2019-03-21
谷歌API
AI 本科專業來了，教育部批了 35 個高校
2019-04-01
AI
Python開發爬蟲專案+程式碼
2019-04-24
Python爬蟲
資深育兒專家智慧體，AI都已經涉及這塊了？
2024-09-04
智慧體AI
小林同學智慧AI大模型語音助手
2024-07-12
AI大模型
AI 大模型企業應用實戰(07)-LangChain的Hello World專案
2024-06-23
大模型LangChain
全面突圍，谷歌昨晚更新了一大波大模型產品
2024-04-10
谷歌大模型
匯智智慧CarrotAI大模型透過大模型服務備案
2024-07-30
AI大模型
智慧合約開發dapp專案解析（原始碼）
2023-02-06
APP原始碼
專案管理的四大模型-原型模型
2020-05-31
專案管理大模型原型
烏拉圭少年發現谷歌安全漏洞獲谷歌3.6萬美元獎勵
2018-05-28
谷歌
官宣開源阿里雲與清華大學共建AI大模型推理專案Mooncake
2024-11-29
阿里AI大模型
關鍵點檢測專案程式碼開源了！
2022-03-30
解碼技術債：AI程式碼助手與智慧體的革新之道
2024-07-08
AI智慧體
寫了8年的程式碼，做過的專案都下線了……
2018-11-04

谷歌內部專案：大模型AI智慧體發現了程式碼漏洞

相關文章