英國《自然》雜誌7月16日發表的一項結構生物學最新研究,世界著名人工智慧團隊深度思維(DeepMind)描述了神經網路“阿爾法摺疊2”(AlphaFold2),就計算機方法而言,“阿爾法摺疊2”能以前所未有的準確度根據蛋白質的氨基酸序列預測其三維結構。
“阿爾法摺疊2”可精準預測蛋白質結構。圖源:《自然》線上版。
蛋白質摺疊問題被認為是人類在21世紀需要解決的重要科學前沿問題之一。理解蛋白質的結構有助於確定蛋白質的功能,瞭解各種突變的作用。
截至目前,約有10萬個蛋白質的結構已經用實驗方法得到了解析,但這在已經測序的數10億計蛋白質中只佔了很小一部分。在過去50多年的時間裡,研究人員一直嘗試根據蛋白質的氨基酸序列預測其摺疊而成的三維結構。然而,當前使用的計算方法準確度有限,實驗方法對人力和時間的要求也非常高。
此次,深度思維首席科學家約翰·詹普爾、創始人兼執行長戴米斯·哈薩比斯及其團隊描述了“阿爾法摺疊2”——一個基於神經網路的新模型,其預測的蛋白質結構能達到原子水平的準確度。研究團隊在2020年5月至7月舉辦的第14屆“蛋白質結構預測關鍵評估”(CASP14)大賽中驗證了這種方法。
機器學習軟體所預測的人類白細胞介素 -12蛋白結合受體的結構圖。圖源:Ian Haydon/UW Medicine Institute for Protein Design
CASP14比賽要求參賽團隊根據蛋白質的氨基酸序列解析它們的結構。比賽用的蛋白質會先用實驗方法解析出來,但具體結果不會公開。比賽中,“阿爾法摺疊2”預測的大部分結構達到了空前的準確度,不僅與實驗方法不相上下,還遠超解析新蛋白質結構的其他方法。將實驗方法得到的蛋白質結構疊加在“阿爾法摺疊2”的結構上,組成蛋白質主鏈骨架的疊加原子之間的距離中位數(95%的覆蓋率)為0.96埃(0.096奈米)。成績排第二的方法只能達到2.8埃的準確度。
“阿爾法摺疊2”的神經網路能在幾分鐘內預測出一個典型蛋白質的結構,還能預測較大蛋白質(比如一個含有2180個氨基酸、無同源結構的蛋白質)的結構。該模型能根據每個氨基酸對其預測可靠性進行精確預估,方便研究人員使用其預測結果。
研究團隊認為,這一精準的預測演算法可以讓蛋白質結構解析技術跟上基因組革命的發展步伐。
戴米斯·哈薩比斯則在一份宣告中表示:在CASP14大會上,他們揭曉了一個可以將蛋白質3D結構預測精確到原子水平的全新“阿爾法摺疊”系統,他們承諾會分享該方法,併為科學共同體提供廣泛、免費的獲取途徑。而今他們邁出了承諾的第一步——在《自然》期刊上分享“阿爾法摺疊”的開原始碼,並發表了系統的完整方法論,以期待看到該方法為科學界啟發出其他新的研究方法。
“阿爾法摺疊”第一代的問世,被認為改變了結構生物學和蛋白質研究的未來:實驗學家將能使用精確結構預測來理解不透明的低溫電磁資料;藥物設計者也可藉此迅速釐清新冠病毒等危險病原體中每種蛋白質的結構,從而更快研發出相關藥物。
本文轉載自科技日報(作者張夢然)