基於神經網路的Alpha Fold改變了生物世界

banq發表於2021-12-20

使用深度學習和神經網路,稱為 Alpha Fold 的演算法有望徹底改變生物化學領域。

在過去的 50 年中,蛋白質摺疊問題一直是一個持續的障礙。它首次出現在 1972 年:一個新理論提出,瞭解蛋白質的氨基酸序列應該可以讓您完全預測其結構。

但是,單個蛋白質可以由多達 2,000 個氨基酸組成。確定它們所有可能的結構可能需要比整個宇宙的年齡更長的時間。這相當於大約 10³⁰⁰ 的可能性,這意味著一個能夠預測蛋白質如何摺疊的系統必須使用比簡單的蠻力更優雅和精確的東西。

自從 1994 年稱為蛋白質結構預測關鍵評估 (CASP) 的競賽開始以來,沒有任何參賽團隊能夠做出準確的預測。

去年,DeepMind 的 Alpha Fold 演算法成為第一個做出越來越準確預測的演算法。Alpha Fold 的預測在 2020 年的平均準確率超過 90%。該演算法取得了驚人的進步,以至於對許多研究人員來說,蛋白質摺疊問題基本上已經得到解決。

如同像 80 年代和 90 年代的計算機程式一樣,Alpha Fold 的第一次迭代並不是很成功。其 2018 年對 CASP 的準確率低於 60%。直到 Alpha Fold 的第二次迭代,才在深度學習的幫助下取得了真正的進步。深度學習是一種模仿人類大腦可能行為方式的機器學習,使機器能夠以比傳統機器學習所需的少得多的人類輸入進行學習。

由節點組成的神經網路構成了深度學習的支柱。神經網路中至少有 3 層節點:輸入層、輸出層和中間的隱藏層。資料在神經網路中的節點之間共享,然後機器做出預測,並可以對照資料集進行檢查。訓練資料有助於機器改進其預測。在 Alpha Fold 的深度學習網路的情況下,訓練資料由來自蛋白質資料庫的摺疊蛋白質組成。此外,Alpha Fold 不是隻有 1 個神經網路,而是有 2 個網路,它們相互協作以摺疊蛋白質、渲染 3D 模型並在最後調整它們的氨基酸比對。

最終,Alpha Fold 解決蛋白質摺疊問題的方法是使用機器來理解機器——畢竟,蛋白質只不過是被程式設計用來輸送氧氣、消化食物以及介於兩者之間的一切的微型機器。這是對人工智慧力量的驚人展示。

儘管目前尚不清楚有多少突破實際上會源於 Alpha Fold 演算法的釋出。它可能需要幾十年的時間才能充分發揮其潛力,以許多意想不到的方式改變世界。

原文點選標題

 

banq個人觀點:深度學習和神經網路來自於模擬大腦,不是真正數學模型,屬於“仿生學”。 神經網路演算法最初來自日本一位生物學家的業餘愛好。

相關文章