Nature回應:為什麼在沒有程式碼的情況下發布AlphaFold3?

ScienceAI發表於2024-05-23
圖片

編輯 | 枯葉蝶

近期,AlphaFold3 在《Nature》雜誌釋出,但是它沒有開源,因此引來了學界的一些爭議。《Nature》官方對此做出了回應,以下為回應內容。

圖片

蛋白質結構預測演算法 AlphaFold 的最新迭代自發布以來,引起了人們的極大興趣。2024 年 5 月上旬,《Nature》雜誌上發表了一篇論文,介紹了 AlphaFold3。

與其前身 AlphaFold2 不同,AlphaFold3 不僅可以預測蛋白質複合物的結構,還可以預測蛋白質何時與其他型別的分子(包括 DNA 和 RNA)相互作用。人工智慧工具在基礎研究和藥物發現中都將發揮重要作用。

但它的釋出也引發了對 Google DeepMind 的 AlphaFold 團隊和 Nature 的質疑和批評。當年,AlphaFold2 釋出時,所有研究人員都可以訪問完整的底層程式碼。但 AlphaFold3 附帶了「虛擬碼」——詳細描述了程式碼的功能及其工作原理。

這不是《Nature》團隊輕易做出的決定,這篇社論簡要解釋了理由。《Nature》團隊認為,無論哪個部門從事研究,都應該透過同行評審進行評估並發表,以造福社會和科學。

與此同時,《Nature》團隊也不希望這成為最終的決定。在全球大多數研究都是私人資助的情況下,這是所有研究利益相關者之間進行重要對話的機會。

社群如何使用新版本 AlphaFold 的基本原理保持不變:任何擁有 Google 帳戶的人都可以免費使用該工具用於非商業應用。但最新的迭代與之前的迭代之間存在重要差異。

值得注意的是,對於 AlphaFold2,DeepMind 團隊與歐洲分子生物學實驗室的歐洲生物資訊學研究所合作,這是一個位於英國劍橋的政府間(公共資助)研究組織。DeepMind 研究人員利用數千份已發表的蛋白質結構及其已知形狀記錄來訓練他們的軟體。

現在,DeepMind 已與 Isomorphic Labs 合作,Isomorphic Labs 是一家總部位於倫敦的藥物開發公司,由谷歌母公司 Alphabet 擁有。除了無法獲得完整程式碼之外,該工具的使用還存在其他限制——例如在藥物開發中。個別研究人員每天可以執行的預測數量也有限制。

許多研究人員對這些限制感到失望。在一封致《Nature》的公開信中,其作者指出,缺乏開原始碼限制了驗證和再現性工作。這封信產生了影響。該模型釋出後不久,DeepMind 研究副總裁 Pushmeet Kohli 在社交媒體平臺 X 上發帖稱,該團隊「致力於在六個月內釋出 AF3 模型(包括權重)供學術使用」。這是重要的一步,一旦程式碼釋出,Nature 將更新已發表的論文。

公開信連結:go.nature.com/3k9acav

但為什麼要在釋出時限制完整的資料和程式碼呢?《Nature》雜誌的編輯規則是為了支援開放科學而制定的,並規定:「作者必須立即向沒有不正當資格的讀者提供材料、資料、程式碼和相關協議。」《Nature》團隊幫助研究人員實現這一目標的方法之一是與 Code Ocean 合作,Code Ocean 是一個計算科學平臺,使資訊可重複且可追蹤。

但《Nature》團隊的規則也承認可能存在限制,「必須在提交時向編輯披露」並徵得編輯同意。該規則還規定:「任何妨礙程式碼或演算法共享的原因都將由編輯進行評估,如果重要程式碼不可用,他們保留拒絕論文的權利。」

限制的原因包括缺乏全學科的資料包告標準或公開儲存資料和結構化儲存庫所需的技術基礎設施。在其他情況下,可能必須保護機密性,或者出於安全、安保或法律原因可能會保留資料。類似的原則也適用於程式碼的可用性,這就是為什麼《Nature》的規則包括髮布訓練模型和虛擬碼或有限程式碼的選項,正如《Nature》在化學、氣候變化和病毒學領域發表的研究示例所證明的那樣。

私營部門為大多數全球研究和開發提供資金,此類工作的許多成果並未在同行評審的期刊上發表。《Nature》雜誌團隊認為,期刊與私營部門合作並與其科學家合作非常重要,這樣他們就可以提交研究成果以供同行評審和出版。這促進了知識共享、研究驗證以及研究人員所追求的可重複性。它還有利於產品的安全性和功效。進步需要更多而不是更少的開放資料和程式碼——《Nature》將繼續支援這一點。

但這個目標不會一步實現。這需要一個過程。這需要所有利益相關者之間的參與和對話。

《Nature》團隊重申:「我們不希望我們的意見成為最終決定,而是對話的開始。我們可以採取哪些進一步措施來確保研究生態系統中各方的開放性?我們希望聽到所有利益相關者的意見——不僅來自大學和私營公司的研究人員,還來自規則制定者、非政府組織和出版商。請寫信給我們。我們將使用這些頁面來更新給讀者。」

郵件地址:communications@nature.com

相關內容:https://www.nature.com/articles/d41586-024-01463-0

相關文章