首個全自動科學發現AI系統，Transformer作者創業公司Sakana AI推出AI Scientist

ScienceAI發表於2024-08-13

原文網址 : https://www.jiqizhixin.com/articles/2024-08-13-3

AIORM創業

編輯 | ScienceAI

一年前，谷歌最後一位 Transformer 論文作者 Llion Jones 離職創業，與前谷歌研究人員 David Ha共同創立人工智慧公司 Sakana AI。Sakana AI 聲稱將建立一種基於自然啟發智慧的新型基礎模型！

現在，Sakana AI 交上了自己的答卷。

Sakana AI 宣佈推出 AI Scientist，這是世界上第一個用於自動化科學研究和開放式發現的 AI 系統！

從構思、編寫程式碼、執行實驗和總結結果，到撰寫整篇論文和進行同行評審，AI Scientist 開啟了 AI 驅動的科學研究和加速發現的新時代。

原則上，它可以不斷重複科學研究過程，以開放式的方式迭代開發想法，就像人類科學家一樣。

研究人員透過將其應用於機器學習的三個不同子領域來展示它的多功能性：擴散建模、基於 Transformer 的語言建模和學習動力學。

每個想法都會被實施並發展成一篇完整的論文，每篇論文的成本不到 15 美元。為了評估生成的論文，研究人員設計並驗證了一個自動審閱器，它在評估論文分數方面的表現接近人類。

AI Scientist 可以撰寫出超過頂級機器學習會議接受門檻的論文。

AI Scientist 的推出標誌著朝著充分發揮人工智慧在科學研究中的潛力邁出了重要一步。透過自動化發現過程並整合人工智慧驅動的審查系統，為最具挑戰性的科學技術領域的創新和解決問題開啟了無限可能之門。

相關研究以「The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery」為題，於 8 月 12 日釋出在預印平臺 arXiv 上。

論文連結：https://arxiv.org/abs/2408.06292

人工智慧面臨的一大挑戰是開發能夠進行科學研究和發現新知識的智慧體。雖然前沿模型已被用作人類科學家的輔助工具，例如集思廣益、編寫程式碼或執行預測任務，但它們仍然只完成了科學過程的一小部分。

在最新的研究中，Sakana AI 的科學家提出了第一個全自動科學發現的綜合框架，使前沿大型語言模型能夠獨立進行研究並傳達其研究結果。

AI Scientist 可以產生新穎的研究想法、編寫程式碼、執行實驗、視覺化結果、透過撰寫完整的科學論文描述其研究結果，然後執行模擬審查流程進行評估。

關於AI Scientist

AI Scientist 有三個主要階段：（1）創意生成，（2）實驗迭代，（3）論文撰寫。撰寫完成後，研究人員會引入並驗證 LLM 生成的評論，以評估所生成論文的質量。

圖示：端到端 LLM 驅動的科學發現過程 AI Scientist 的概念說明。（來源：論文）

研究人員為 AI Scientist 提供了一個起始程式碼模板，該模板可重現流行模型或基準的輕量級基線訓練執行。例如，這可能是針對莎士比亞作品訓練小型 transformer 的程式碼，這是自然語言處理中的經典概念驗證訓練執行，可在幾分鐘內完成。

然後，AI Scientist 就可以自由探索任何可能的研究方向。該模板還包括一個 LaTeX 資料夾，其中包含樣式檔案和節標題以及簡單的繪圖程式碼。一般來說，每次執行都是從與主題領域相關的代表性小規模實驗開始的。

研究人員解釋道：「專注於小規模實驗並不是我們方法的根本限制，而只是出於計算效率的因素，以及我們這邊裝置的計算限制。」

為什麼寫論文很重要？

鑑於科學家的總體目標是實現科學發現的自動化，為什麼研究人員要讓 AI Scientist 像人類科學家一樣寫論文呢？例如，以前的人工智慧系統（如 FunSearch 和 GNoME）曾經在受限領域產生了令人印象深刻的科學發現，但它們並不能撰寫論文。

該團隊認為，AI Scientist 撰寫科學論文來傳播其發現至關重要，原因如下：首先，撰寫論文為人類提供了一種高度可解釋的方法，使人類能夠從所學知識中受益；其次，在現有的機器學習會議框架內審查書面論文使科學家能夠標準化評估；第三，自現代科學誕生以來，科學論文一直是傳播研究成果的主要媒介。

由於論文可以使用自然語言，幷包含情節和程式碼，因此它可以靈活地描述任何型別的科學研究和發現。幾乎任何其他可以想到的格式都被鎖定在某種資料或科學型別中。在出現更優的替代方案（或可能由人工智慧發明）之前，該團隊相信訓練 AI Scientist 撰寫科學論文對於其融入更廣泛的科學界至關重要。

圖示：由 AI Scientist 完全自主生成的《Adaptive Dual-Scale Denoising》論文預覽。（來源：論文）

關於成本

這裡的框架非常靈活，可以有效地開展機器學習各個子領域的研究，包括基於 transformer 的語言建模、神經網路學習動態和擴散建模。該系統的成本效益很高，每篇論文的成本約為 15 美元，可生成與會議類相關的論文，凸顯了其使研究民主化（提高其可及性）和加速科學進步的能力。

例如，研究人員對 AI Scientist 的初步定性分析表明，生成的論文可以提供廣泛的資訊和新穎性，或者至少包含值得未來研究的想法。

按照當下的標準，該團隊為 AI Scientist 進行實驗分配的實際計算量也非常小。值得注意的是，研究人員在一週內生成數百篇論文的實驗大部分僅使用單個 8×NVIDIA H100 節點執行。如果大規模擴大搜尋和過濾範圍，可能會產生質量更高的論文。

在這個專案中，執行 AI Scientist 的大部分成本與 LLM API 編碼和論文寫作的成本相關。相比之下，由於該團隊為降低總體成本而施加的限制，執行 LLM 審閱器相關的成本以及進行實驗的計算費用可以忽略不計。

當然，如果 AI Scientist 被應用到其他科學領域或用於更大規模的計算實驗，這種成本分攤在未來可能會發生變化。

開放與封閉模型

為了定量評估和最佳化生成的論文，研究人員首先建立並驗證了自動論文審閱器。結果表明，雖然還有很大的最佳化空間，但 LLM 能夠產生相當準確的評論，並在各個指標上取得與人類相當的結果。

圖示：Violin 圖顯示了 AI Scientist 審閱者在三個領域和四個基礎模型中為人工智慧生成的論文的評分分佈。（來源：論文）

將這個審閱器應用於 AI Scientist 生成的論文，使科學家能夠將論文評估範圍擴大到人工檢查之外。研究人員發現 Sonnet 3.5 始終能生成最好的論文，其中一些論文的分數甚至超過了自動論文審閱器在標準機器學習會議上的接受門檻。

但是，該團隊沒有理由期望 AI Scientist 像 Sonnet 3.5 這樣的單一模型能夠保持領先地位。研究人員認為所有前沿 LLM（包括開放模型）都將繼續最佳化改進。LLM 之間的競爭會使它們的商品化和能力都大幅增強。

圖示：使用 GPT-4o 對 ICLR 2022 OpenReview 資料上的 AI Scientist 的論文審查流程進行評估。（來源：論文）

在這個專案中，研究人員研究了各種專有的 LLM，包括 GPT-4o 和 Sonnet，但也探索了使用 DeepSeek 和 Llama-3 等開放模型。發現開放模型具有顯著的優勢，例如成本更低、可用性有保證、透明度更高、靈活性更高，儘管質量略差。

未來，研究人員的目標是利用所提出的發現過程，在使用開放模型的閉環系統中產生自我改進的人工智慧。

未來方向

對 AI Scientist 的直接改進可能包括整合視覺功能以更好地處理圖表和圖形，結合人類反饋和互動來改進人工智慧的輸出，並使 AI Scientist 能夠透過從網際網路上提取新資料和模型來自動擴大其實驗範圍，前提是這樣做是安全的。

此外，AI Scientist 可以跟進其最佳想法，甚至可以以自參考的方式直接對自己的程式碼進行研究。事實上，該專案的大部分程式碼都是由 Aider 編寫的。將框架擴充套件到其他科學領域可以進一步擴大其影響力，為自動化科學發現的新時代鋪平道路。

至關重要的是，未來的工作應該解決可靠性和幻覺問題，可能透過對報告的結果進行更深入的自動驗證來實現。這可以透過直接連結程式碼和實驗來實現，或者透過檢視自動驗證器是否可以獨立重現結果來實現。

結語

AI Scientist 標誌著機器學習科學發現新時代的開始：將 AI 智慧體的變革性優勢帶入 AI 本身的整個研究過程，並讓科學家更接近一個可以釋放無限且經濟實惠的創造力和創新，來解決世界上最具挑戰性的問題的世界。

最終，「我們設想一個完全由人工智慧驅動的科學生態系統，不僅包括人工智慧驅動的研究人員，還包括審稿人、領域主席和整個會議。然而，我們並不認為人類科學家的作用會減弱。隨著我們適應新技術並向食物鏈上游移動，科學家的作用將發生變化。」研究人員在論文裡表示。

雖然 AI Scientist 的當前迭代展示了在成熟理念（如擴散建模或 Transformers）之上進行創新的強大能力，但此類系統最終是否能夠提出真正顛覆正規化的理念仍是一個懸而未決的問題。

未來版本的 AI Scientist 是否能夠提出像擴散建模一樣具有影響力的想法，或者提出下一個 Transformer 架構？機器最終是否能夠發明像人工神經網路或資訊理論一樣基本的概念？

「我們相信 AI Scientist 將成為人類科學家的絕佳夥伴，但只有時間才能告訴我們。」

GitHub 開源地址：http://github.com/SakanaAI/AI-Scientist

論文連結：https://arxiv.org/abs/2408.06292

參考內容：

http://sakana.ai/ai-scientist/

https://x.com/SakanaAILabs/status/1823178623513239992

https://mp.weixin.qq.com/s/-jjXBJAkdMEyl2JhRgwdaA

首次！大模型自動搜尋人工生命，做出AI科學家的Sakana AI又放大招
2024-12-25
大模型AI
創新能力超越AI Scientist，上海AI Lab「AI 科研團隊」VirSci來了
2024-11-04
AI
「AI Scientist」會給科學帶來什麼？AI for Science 熱潮下的爭議
2024-09-16
AI
科學實驗室走向全自動化，機器人融合AI，加速科學發現，Science子刊觀點
2024-10-28
機器人AI
重返谷歌的Transformer作者，開始掌管Gemini AI
2024-08-23
谷歌ORMAI
Transformer作者回流谷歌，Character.AI創始團隊被「收購」，只要人不要公司
2024-08-04
ORM谷歌AI
米粿AI：AI動漫賽道頭部創業公司招聘AI演算法實習生/工程師
2024-08-20
AI創業演算法工程師
新「AI科學家」？MIT整合多智慧體，實現材料科學研究自動化
2024-09-27
AIMIT智慧體
AI測試101：測試AI系統的實用技巧&ML和AI自動化工具
2023-04-18
AI
AI天璣系統全球首發，小鵬汽車全面進入AI時代
2024-04-25
AI
18個月，開創AI藥研先例，Insilico公開其首款AI藥物研發全過程，登Nature子刊
2024-03-15
AI
入局AI Search，阿里國際推出全球首個B2B AI搜尋引擎Accio
2024-11-14
AI阿里
上海AI實驗室推出自主學習作業系統OS-Copilot
2024-02-15
AI作業系統
天工AI推出彩頁功能，聚焦AI閱讀質感+創作效能
2024-12-06
AI
100%國產的AI作業系統，現在開源了！還有個AI版的App Store
2021-06-24
AI作業系統APP
AI賦能音樂創作，人人都是音影片創作者
2022-11-23
AI
Splunk推出AI功能
2018-05-01
AI
AI 大戰 AI，一個深度強化學習多智慧體競賽系統
2023-03-08
AI強化學習智慧體
走進AI科學之美
2019-09-17
AI
AI 實現 UI 自動化操作方案
2025-02-17
AIUI
AI機器學習自動化的四個等級
2021-05-21
AI機器學習
行業首個養成系AI 萌寵，就在夢幻西遊
2024-09-02
行業AI
Oracle推出全球首個自治作業系統
2019-09-20
Oracle作業系統
“全棧”：從AI開發者到AI工業家的首席關鍵詞
2019-11-23
全棧AI
聯合Science，面向青年學者，陳天橋推出AI驅動科學研究國際大獎
2024-08-21
AI
谷歌母公司Alphabet投資AI晶片初創公司
2018-03-22
谷歌AlphabetAI晶片
美國西北大學聯合AI創企Eko，推出心臟雜音AI篩查演算法
2019-03-11
AI演算法
多 AI 智慧體系統- AI 智慧體的 6 個關鍵要素
2024-05-27
AI智慧體
「顛覆性」科學沒有衰落，谷歌 AI 推動科學發展的 9 種方式
2024-11-21
谷歌AI
【特色活動】挖掘AI明日之星，構築發展新動能：AI青年科學家聯盟舉辦“創新動能智匯傳承”論壇
2019-07-23
AI
AI首次公開擊敗人類法律翻譯，前獵豹首席科學家為何跨界創立法律AI公司？|獨家
2019-04-19
AI
AI自動化將如何影響就業？
2018-12-24
AI就業
更新、挑錯、識別假新聞，MIT推出維基百科AI編輯系統
2020-07-20
MITAI
李開復：AI創業的十個真相|深度
2018-04-23
AI創業
AI如何推動退休和養老系統現代化
2024-11-24
AI
夸克釋出全新PC端，系統級全場景AI能力升級AI電腦
2024-08-27
AI
網易2022GDC | AI動畫師：實時動作補全系統
2022-07-19
AI動畫
自動機器學習和AI初學者指南
2018-12-04
機器學習AI

首個全自動科學發現AI系統，Transformer作者創業公司Sakana AI推出AI Scientist

相關文章