編輯 | ScienceAI
由上海人工智慧實驗室提出的 VirSci(Virtual Scientists)系統是一個基於大語言模型(LLM)的多智慧體協作平臺,專注於模擬科學家團隊的合作過程,從而加速科研創新。
不同於以往的單智慧體系統,VirSci 透過使用真實科學家的資料來模擬科學團隊的多人協作,不僅可以透過團隊成員的合作討論來生成更具創新性和影響力的科研想法,還展現出作為「科學學」(Science of Science)研究工具的巨大潛力。
該研究以「Two Heads Are Better Than One: A Multi-Agent System Has the Potential to Improve Scientific Idea Generation」為題,於 2024 年 10 月 12 日釋出在 arXiv 預印平臺。
論文地址:https://arxiv.org/pdf/2410.09403
VirSci 多智慧體系統
VirSci 的核心工作流程主要分為五個核心步驟:團隊成員選擇、研究主題討論,到 Idea 生成、創新性評估和摘要生成。
VirSci 根據真實學術資料,為每位智慧體配備了獨立的科研背景資訊,透過跨領域的團隊合作、相互啟發、知識補充,從而激發出更多 Idea。
在科研協作過程中,VirSci 還會基於討論內容查詢並閱讀論文來不斷調整,最終生成有創新性的科研想法和內容。
VirSci 系統在創新性和影響力上的提升
為了驗證 VirSci 在科研創新上的優勢,VirSci 研究團隊將其生成的科研想法與目前的單智慧體 SOTA 模型(AI Scientist)所生成的進行了對比分析。結果顯示,VirSci 在創新性和影響力上的表現均顯著優於 AI Scientist。
具體而言,VirSci 系統生成的研究摘要在「新穎性(CD)」和「影響力(CI)」兩方面均表現突出,既能貼近當前學術趨勢(即 CD 低),又具備較高的潛在引用影響力(即 CI 高)。
此外,在 AI Scientist 中提出的基於大語言模型的評價指標(LLM Review Score)上,VirSci 也展現出優勢,這說明多智慧體協作模式對提升科研創新性具有積極作用。
面向未來的科學學領域應用
VirSci 系統不僅限於加速科研創新,它還展現出在科學學(Science of Science)研究領域中的應用潛力。
研究團隊透過實驗探究了 VirSci 系統中的團隊構成對創新性的影響,研究內容主要包括 VirSci 系統中的不同團隊規模、討論輪次、團隊新鮮度和研究多樣性對最終生成結果的影響。
在不同團隊規模與不同討論輪數的實驗中,為了確保比較的公平性,不同團隊構成的實驗都在相同的推理消耗下進行比較(總的推理輪數相同)。
實驗結果表明,適當的團隊規模和討論輪數能夠顯著提升創新性。透過對比不同團隊規模和不同討論輪次的實驗結果發現,規模適中的團隊(8人)在 5 輪討論後創新性達到最高;而過大的團隊規模或過多的討論輪次可能導致協調困難和創意枯竭,從而降低創新性表現。
在不同團隊新鮮度的實驗中,團隊新鮮度表示團隊成員之間存在首次合作的人數比例。實驗發現,當團隊成員的新鮮度在 50% 時,團隊的創新性達到最高,這表明在新舊成員合理混合的情況下,團隊能夠實現最佳的科研創新表現。
透過保持適度的新鮮度,團隊不僅能發揮已有的協作默契,還能在多樣化的視角中產生更多新穎想法。
最後,研究團隊透過實驗考察了 VirSci 系統中團隊成員在研究背景上的多樣性對結果創新性的影響。
實驗顯示,4 人團隊與 8 人團隊分別在 50% 和 75% 的多樣性水平時,生成的科研想法展現出較最高的創新性和影響力,這表明適當的學科多樣性有助於激發團隊成員之間的跨領域互動,從而帶來更具影響力的科研成果。
立即體驗 VirSci
VirSci 現已開放供科研人士試用。透過這個平臺,您將能夠體驗到一個由智慧體團隊支援的、充滿創造力的科研創新環境。歡迎來自各界的科研人員前來體驗 VirSci,感受多智慧體協作系統在學術創新加速中的強大潛力!
Github:https://github.com/open-sciencelab/Social_Science
專案網頁:https://open-sciencelab.github.io/Social_Science/