編輯 | ScienceAI
近日,成立僅 6 個月的 AI 生物技術初創公司 Chai Discovery,釋出用於分子結構預測的新型多模態基礎模型 Chai-1,並附帶了一份技術報告,比較了 Chai-1 與 AlphaFold 等模型的效能。
Chai-1 可以統一預測蛋白質、小分子、DNA、RNA、共價修飾等,在與藥物發現相關的各種任務中都達到 SOTA。
公司聯合創始人兼 CEO Joshua Meier 表示,Chai 的模型在測試的基準上表現更佳,成功率提升 10% 到 20%。
他說:「例如,與 AlphaFold 相比,我們的模型在藥物研發中的關鍵任務上始終表現更好。」
而且,可透過 Web 介面免費使用 Chai-1,還可用於藥物發現等商業應用。該團隊還將模型權重和推理程式碼作為軟體庫釋出,供非商業使用。
預測分子結構的多模態基礎模型
瞭解生物分子的三維結構對於研究它們如何發揮作用和相互作用至關重要。反過來,這種理解是設計針對生命細胞機制的治療分子的基礎。
過去幾年,使用深度學習方法預測蛋白質和核酸的摺疊結構取得了重大進展。RoseTTAFold All-Atom 和 AlphaFold3 等方法引入了可以預測各種蛋白質和核酸結構、其共價修飾以及小分子配體與這些複合物相互作用的模型。
Chai-1 是一種用於預測分子結構的多模態基礎模型,可以完成與藥物發現相關的各種任務。該模型遵循 Abramson 等人的架構並進行了一些關鍵新增,包括語言模型嵌入和約束特徵等。
雖然 Chai-1 旨在直接從原始序列和化學輸入預測生物聚合物結構,但它也可以選擇性地透過實驗約束來提示,例如表點陣圖譜或交聯質譜實驗所提供的約束,從而實現對困難結合複合物的更準確預測。
圖示:Chai-1 模型架構和輸入特性概述。(來源:Chai Discovery)
預測蛋白質、核酸所有分子相互作用
Chai Discovery 研究人員在大量基準測試中測試了 Chai-1。
圖示:基準測試。(來源:Chai Discovery)
研究人員在 PoseBusters 基準集上評估 Chai-1,該基準集測量蛋白質-配體相互作用。結果顯示,僅給定蛋白質序列和配體的化學組成,Chai-1 的配體 RMSD 成功率達到 77%,與 AlphaFold3 的 76% 相當。在 CASP15 蛋白質單體結構預測集上的 Cα LDDT 為 0.849(而 ESM3-98B 為 0.801)。
為了評估 Chai-1 的提示和條件能力,研究人員還對對接任務進行了評估。指定蛋白質的 apo 結構可將成功率提高到 81%。
該團隊發現,蛋白質的全息結構可能會洩露使任務更容易的構象資訊,因此他們主要將此任務視為評估模型的快速跟蹤能力的一種方式。
研究人員在低同源性評估集上評估 Chai-1 對蛋白質多聚體的預測效能,發現其效能優於 AlphaFold Multimer 2.3(AF2.3),在單序列模式下也有較好表現,尤其在抗體 - 蛋白質介面預測中表現出色。
圖示:對評估集介面上模型預測的置信度分數與真實結構進行評估。(來源:Chai Discovery)
蛋白單體預測方面,研究人員將 Chai-1 與 AF2.3 比較,發現 Chai - 1 在有完整 MSA 資訊時優於 AF2.3,在無 MSA 資訊時表現略差。
核酸結構預測方面,不依賴核酸 MSA 時,使用介面 Cα-LDDT 評估, Chai-1 在這些複合物上的表現與 RosettaFold2NA 相似。
同時,還使用 9 個 CASP15 RNA 靶標測量 C1′ 原子上的 LDDT,評估了其在 RNA 結構上的表現。同樣,Chai-1 與 RoseTTAFold2NA 產生了類似的結果。
圖示:Chai-1 在核酸複合物預測上的表現。(來源:Chai Discovery)
儘管 Chai-1 經過訓練並且無需 MSA 即可對核酸序列進行推理,而 RoseTTAFold2NA 可以完全訪問此類進化資訊,但仍然取得了不錯的結果。研究人員表示,未來的研究結合核酸 MSA 或核酸語言模型嵌入,可以提高其在對這些複合物進行建模時的準確性。
除了直接從序列進行前沿建模的能力外,Chai-1 還可以使用新資料(例如來自實驗室的限制)進行提示,從而將效能提高 double-digit 百分點。
研究人員在技術報告中探討了許多這樣的能力,例如表位調節 - 即使使用少量接觸或口袋殘基(可能來自實驗室實驗)也可以使抗體-抗原結構預測準確度翻倍,從而使使用 AI 進行抗體工程變得更加可行。
圖示:來自低同源性評估集的抗體-抗原介面的 DockQ 成功率;針對 PDB ID 7SYV 的示例預測。(來源:Chai Discovery)
未來願景
該團隊由來自 OpenAI、Meta FAIR 和 Google X 等領先 AI 和生物技術組織的先驅者組成,處於 AI 驅動的生物學研究的前沿。
Chai-1 的釋出標誌著他們徹底改變分子生物學領域的里程碑。然而,該團隊已經在考慮下一代 AI 基礎模型。他們的最終目標是建立能夠預測和重新程式設計生化分子之間相互作用的模型。這一願景可能會改變科學家處理生物研究和工程的方式,從而加速開發新的治療方法和療法。
雖然 Chai-1 的釋出是一項重大成就,但 Chai Discovery 團隊認為這只是一個開始。在接下來的幾個月裡,他們計劃繼續改進 Chai-1 並開發新的模型,來突破分子結構預測的極限。
總之,Chai-1 的釋出標誌著分子結構預測領域的一個里程碑。憑藉其 SOTA 效能、多模態功能以及可訪問性,Chai-1 有可能徹底改變藥物發現和生物工程。
成立僅 6 個月,OpenAI 投資
Chai Discovery 是一家成立僅六個月的 AI 醫藥開發初創公司,它宣佈完成了近 3000 萬美元的融資,投資方包括知名投資公司 Thrive Capital 和 OpenAI。這筆資金將用於將 AI 技術應用於藥物研發過程,以期加速新藥的研發。
公司聯合創始人兼 CEO Joshua Meier 表示:「我們的目標是讓生物學像工程一樣可預測,加速藥物開發程序。」
Chai Discovery 的總部位於舊金山,公司最近完成了種子輪融資,使 Chai 的估值達到了 1.5 億美元。
在創立 Chai 之前,Meier 曾擔任 Absci Corp. 的首席 A I官,還在 Meta 和 OpenAI 擔任過研究員。
今年 3 月,他與 Jack Dent 等人共同創立了 Chai。Jack Dent 曾是 Stripe 的一名工程師,目前 Chai 的團隊規模不到 10 人,但已經吸引了來自 OpenAI、谷歌和 Meta 等科技巨頭的優秀人才。
Chai 聯合創始人 Jack Dent 表示,公司免費提供其首個 AI 模型,當前還沒有討論將其技術商業化的計劃。
Chai 投資的主導者、Thrive Capital 的合夥人 Miles Grimshaw 表示:「這個領域足夠大,可以容納所有人。在這個領域工作的一個好處是,即使是一點點的進步也是非常有利可圖的。」
參考內容:
https://www.chaidiscovery.com/blog/introducing-chai-1
https://www.marktechpost.com/2024/09/10/chai-1-released-by-chai-discovery-team-a-groundbreaking-multi-modal-foundation-model-set-to-transform-drug-discovery-and-biological-engineering-with-revolutionary-molecular-structure-prediction/
https://www.maginative.com/article/chai-discovery-releases-powerful-new-open-ai-model-for-molecular-structure-prediction/
https://x.com/joshim5/status/1833183091776721106
https://wallstreetcn.com/articles/3727491
GitHub:https://github.com/chaidiscovery/chai-lab