量子級精度,靜態到動態,微軟蛋白MD模擬系統登Nature

ScienceAI發表於2024-11-07

圖片

編輯 | KX

生物世界的本質在於分子及其相互作用的不斷變化。瞭解生物分子的動力學和相互作用對於破譯生物過程背後的機制,以及開發生物材料和藥物至關重要。

正如諾貝爾物理學獎得主理查德·費曼(Richard Feynman)的名言:「所有生物體的行為都可以透過原子的顫動和擺動來理解。」然而,透過實驗捕捉這些真實的運動幾乎是不可能的。

近年來,以 AlphaFold 和 RoseTTAFold 為代表的深度學習方法,在預測靜態晶體蛋白質結構方面已經達到了實驗精度,相關研究人員獲得了 2024 年諾貝爾化學獎。然而,以原子解析度準確表徵動力學仍然更具挑戰性,尤其是當蛋白質發揮作用並與其他生物分、藥物分子相互作用時。

經典分子動力學(MD)模擬速度快,但缺乏化學準確性。密度泛函理論(DFT)等量子化學方法可以達到化學精度,但無法擴充套件到大型生物分子。

MD 模擬用於模擬生物分子的時間相關運動。如果你將蛋白質想象成時鐘中複雜的齒輪,那麼微軟研究院科學智慧中心開發的從頭算精度的生物分子模擬方法 AI2BMD,不僅會將它們捕捉到位,還會觀察它們的旋轉,揭示它們的運動如何驅動維持生命運轉的複雜過程。

相關研究於 11 月 6 日刊登在《Nature》上。

圖片

論文連結:https://www.nature.com/articles/s41586-024-08127-z

基於 AI 的從頭算生物分子動力學系統

AI2BMD 是一種基於 AI 的從頭算生物分子動力學系統。AI2BMD 可以以近似從頭算的精度(即量子級的精度),高效地對各類蛋白質進行了全原子模擬模擬。

與密度泛函理論相比,它將計算時間縮短了幾個數量級。最新發現可以解鎖生物分子建模的新功能,特別是對於需要高精度的過程,例如蛋白質-藥物相互作用。

圖片

圖 1:AI2BMD 流程圖。

AI2BMD 採用一種設計新穎的可通用蛋白質碎片化方法,將蛋白質分割成重疊單元,從而建立一個包含 2000 萬個快照的資料集,這是 DFT 級別有史以來最大的資料集。基於微軟之前設計的通用分子幾何建模基礎模型 ViSNet,並將其納入 PyTorch geometry 庫。

研究人員使用機器學習訓練了 AI2BMD 的勢能函式。然後由高效的 AI2BMD 模擬系統執行模擬,其中在每個步驟中,基於 ViSNet 的 AI2BMD 勢能以從頭算精度計算蛋白質的能量和原子力。透過動力學和熱力學的綜合分析,AI2BMD 與溼實驗室資料表現出更好的一致性。

推進生物分子 MD 模擬

AI2BMD 在以下方面代表了 MD 模擬領域的重大進步:

(1)從頭算精度:引入了一種可推廣的「機器學習力場」,即原子和分子之間相互作用的機器學習模型,用於從頭算精度的全原子蛋白質動力學模擬。

圖片

圖 2:AI2BMD 與分子力學(MM)對不同蛋白質的能量計算誤差的評估。(來源:論文)

(2)解決泛化問題:首次解決了機器學習力場模擬蛋白質動力學的泛化難題,為多種蛋白質提供了穩健的從頭算 MD 模擬。

(3)普遍相容性:AI2BMD 將量子力學(QM)建模從小的區域性區域擴充套件到整個蛋白質,而無需任何關於蛋白質的先驗知識。這消除了蛋白質 QM 和 MM 計算之間潛在的不相容性,並將 QM 區域計算速度提高了幾個數量級,使全原子蛋白質的近乎從頭算計算成為現實。因此,AI2BMD 為眾多下游應用鋪平了道路,併為表徵複雜的生物分子動力學提供了新的視角。

(4) 速度優勢:AI2BMD 比 DFT 和其他量子力學快幾個數量級。它支援超過 1 萬個原子的蛋白質的從頭算計算,使其成為多學科領域中最快的 AI 驅動 MD 模擬程式之一。

圖片

圖 3:AI2BMD、DFT 和其他 AI 驅動的模擬軟體之間的時間消耗比較。

(5)多樣化構象空間探索:對於 AI2BMD 和 MM 模擬的蛋白質摺疊和去摺疊,AI2BMD 探索了 MM 無法探測到的更多可能的構象空間。因此,AI2BMD 為研究藥物-靶標結合過程中的柔性蛋白質運動、酶催化、變構調控、內在無序蛋白等提供了更多的機會,更好地與溼實驗室實驗相結合,為生物機制檢測和藥物發現提供更全面的解釋和指導。

圖片

圖 4:AI2BMD 從未摺疊結構開始摺疊 Chignolin 蛋白質,能量誤差小於 MM,並且探索了更多 MM 無法檢測到的構象區域。

(6)實驗一致性:AI2BMD 優於 QM/MM 混合方法,並且在不同的生物應用場景中與溼實驗室實驗表現出高度一致性,包括 J 偶聯、焓、熱容量、摺疊自由能、熔化溫度和 pKa 計算。

展望未來

在生物分子模擬中實現從頭算精度具有挑戰性,但對於理解生物系統的奧秘以及設計新的生物材料和藥物潛力巨大。這一突破證明了 AI for Science 的遠見,即利用人工智慧的能力革新科學探索。AI2BMD 旨在解決機器學習力場應用中關於準確性、穩健性和泛化的侷限性。AI2BMD 透過考慮蛋白質的基本結構,即氨基酸的延伸,在模擬各種蛋白質系統方面提供了通用性、適應性和多功能性。這種方法增強了能量和力的計算以及動力學和熱力學性質的估計。

AI2BMD 的一個關鍵應用是它能夠執行高精度的虛擬篩選以發現藥物。2023 年,在首屆全球 AI 藥物開發競賽上,AI2BMD 取得了突破,預測了一種與 SARS-CoV-2 主要蛋白酶結合的化合物。它的預測精度超越了所有其他競爭對手,穩居第一,並展示了其在加速現實世界藥物發現工作方面的巨大潛力。

自 2022 年以來,微軟研究院還與全球健康藥物研發中心 (GHDDI) 合作,應用 AI 技術設計藥物,用於治療影響中低收入國家 (LMIC) 的疾病,例如結核病和瘧疾。現在,微軟與 GHDDI 密切合作,利用 AI2BMD 和其他 AI 功能來加速藥物發現過程。

AI2BMD 不僅推進了對科學問題的研究,還促進了藥物發現、蛋白質設計和酶工程等領域的新的生物醫學研究。

參考內容:https://www.microsoft.com/en-us/research/blog/from-static-prediction-to-dynamic-characterization-ai2bmd-advances-protein-dynamics-with-ab-initio-accuracy/

相關文章