準確預測蛋白質「運動」?AlphaFold融合物理知識,南京大學團隊蛋白構象運動新策略

ScienceAI發表於2024-08-29

圖片

編輯 | KX

蛋白質如何進行構象運動,不僅是一個基本的生物物理問題,而且對於藥物設計等實際應用也至關重要。儘管深度學習方法,比如 AlphaFold2 和 RoseTTAFold,可以高通量預測蛋白質的靜態結構,但預測構象運動仍然是一個挑戰。

在此,南京大學、香港浸會大學(Hong Kong Baptist University)、中國科學院大學以及昌平實驗室和萊斯大學合作,找到了一種新的方法來預測蛋白質在發揮作用時如何改變形狀,這對於瞭解它們在生物系統中的工作方式非常重要。

研究人員提出了一種解決構象運動的策略,即將 AF2 的預測能力與蛋白質構象運動的能量景觀分析相結合。研究表明,區域性能量挫折(量化變構蛋白質的能量景觀特徵)可用於增強 AlphaFold2 預測蛋白質構象運動的能力。

「從預測的靜態基態結構開始,新方法透過首先發現,然後逐步增強編碼蛋白質進化發展的輸入多序列比對序列中的能量挫折特徵,從而為蛋白質運動產生替代結構和途徑。」共同通訊作者、萊斯大學的 Peter Wolynes 教授說。

此外,還研究了 AF2 的工作原理,表明將能量景觀的物理知識與 AI 相結合,不僅有助於預測蛋白質的運動方式,而且還解釋了為什麼 AI 會過度預測結構完整性,從而只產生最穩定的結構。

相關研究以「Predicting protein conformational motions using energetic frustration analysis and AlphaFold2」為題,釋出在《PNAS》上。

圖片

論文連結:https://www.pnas.org/doi/10.1073/pnas.2410662121

蛋白質的大規模構象運動對許多生物過程至關重要,例如催化、訊號轉導和運輸。天然蛋白質的序列已經進化形成獨特的能量景觀,這不僅決定了相應的三維天然結構,還決定了它們與功能相關的運動。

AlphaFold2 (AF2) 和 RoseTTAFold 成功地直接從序列生成結構,正是透過利用進化資料才得以實現。

能量景觀理論表明,雖然進化塑造了蛋白質的能量景觀,使它們可以摺疊成最佳結構,但偏離原本引導摺疊的完美漏斗景觀,即區域性挫折,對於蛋白質的功能運動至關重要。

AF2 和 RoseTTAFold 在直接生成蛋白質三維結構方面取得的巨大成功啟發我們思考:是否有可能將這種資料驅動的方法與現有的關於能量景觀的物理思想相結合,從而直接預測大規模蛋白質構象運動,而無需進行分子動力學模擬?

基於此,南京大學研究團隊利用 AF2 使用 MSA 進化資料的能力,提出了一種將 AF2 的結構預測能力與蛋白質能量挫折分析相結合以預測蛋白質構象運動的方法。

圖片

圖示:AF2 預測蛋白質動力學的物理規律示意圖。(來源:論文)

挫折概念強調了衝突相互作用在蛋白質摺疊、動力學和功能中的作用,為解鎖 AF2 的這種更深層功能提供了關鍵。透過利用基於現有生物物理工具提取的變構蛋白的可用能量挫折模式,研究人員旨在將 AF2 的功能擴充套件到靜態結構預測之外,包括變構蛋白的動力學,從而提高科學家對基因型-表型對映的理解。

這種結合 AF2 和生物物理規則的計算方法,將有助於深入研究蛋白質動力學。

腺苷酸激酶 (AdK) 是一種多結構域蛋白,由 LID 結構域、NMP 結構域和核心結構域組成,已成為研究變構的典型系統。

在該研究中,同樣以 AdK 為模型,展示如何利用由區域性能量挫折分數量化的能量景觀區域性特徵,預測 AF2 的蛋白質構象運動。

研究發現生成的構象運動與可用的實驗和分子動力學模擬資料一致。

圖片

圖示:AdK 的區域性能量挫折。(來源:論文)

將該方法應用於另外兩種涉及大幅度構象變化的蛋白質 KaiB 和核糖結合蛋白,也可以成功生成替代構象。

圖片

圖示:使用挫折過濾策略預測 KaiB 的替代結構。(來源:論文)

能量景觀理論是這種方法的關鍵部分,但目前的大部分 AI 模型被訓練成只會預測蛋白質的最穩定結構,而忽略了蛋白質在發揮作用時可能呈現的不同形狀。

透過精確定位受挫區域,研究人員教會了 AI 在指導其預測時忽略這些區域,從而使程式碼能夠準確預測替代蛋白質結構和功能運動。

研究人員使用在能量景觀框架內開發的挫折分析工具,確定了蛋白質中受挫,且因此具有靈活性的區域。

然後,透過操縱 AlphaFold 使用的對齊蛋白質家族序列中的進化資訊,並根據挫折分數,研究人員教會 AI 識別這些受挫區域,從而能夠準確預測它們之間的替代結構和途徑,Wolynes 說。

「在後 AlphaFold 時代,不要忘記或放棄基於物理的方法的重要性,在這個時代,重點是從實驗資料中進行不可知論學習,而無需任何理論輸入,」Wolynes 說。「將 AI 與生物物理學相結合,將對未來的實際應用產生重大影響,包括藥物設計、酶工程和理解疾病機制。」

參考內容:https://phys.org/news/2024-08-artificial-intelligence-frustration-protein.html

相關文章