病毒從何而來?AlphaFold等AI正在尋找答案

ScienceAI發表於2024-09-20
圖片
圖示:登革熱病毒蛋白的結構。(來源:Spyros Lytras 和 Joe Grove)

編譯 | 白菜葉

人工智慧 (AI) 正在幫助重新繪製病毒家族樹。AlphaFold 生成的預測蛋白質結構和受聊天機器人啟發的「蛋白質語言模型」揭示了病毒家族中的一些令人驚訝的聯絡,其中包括感染人類的病原體以及新出現的威脅。

科學家對病毒進化的理解大多基於基因組比較。但病毒(尤其是那些基因組以 RNA 編寫的病毒)的閃電般快速進化以及它們從其他生物體獲取遺傳物質的傾向意味著基因序列可以隱藏病毒之間深遠的關係,而這種關係也可能因所檢查的基因而異。

相比之下,病毒基因編碼的蛋白質的形狀或結構往往變化緩慢,這使得找出這些隱藏的進化聯絡成為可能。但英國格拉斯哥大學分子病毒學家 Joe Grove 表示,在 AlphaFold 等可以大規模預測蛋白質結構的工具出現之前,我們無法比較整個病毒家族的蛋白質結構。

在 9 月發表在《Nature》雜誌上的一篇論文中,Grove 團隊展示了基於結構的方法在研究牛黃病毒中的作用。黃病毒包括丙型肝炎病毒、登革熱病毒和寨卡病毒,以及一些可能對人類健康構成新威脅的主要動物病原體和物種。

圖片

論文連結:https://www.nature.com/articles/s41586-024-07899-8

病毒如何進入

研究人員對黃病毒進化的大部分理解都是基於複製其遺傳物質的緩慢進化的酶序列。然而,研究人員對黃病毒用來入侵細胞的「病毒入侵」蛋白的起源知之甚少,而這些蛋白決定了它們可以感染的宿主範圍。Grove認為,這一差距減緩了有效丙型肝炎疫苗的研發,而丙型肝炎每年導致數十萬人死亡。

「在序列層面上,事物是如此不同,以至於我們無法判斷它們是否相關。」他說,「蛋白質結構預測的出現解開了整個問題,我們可以非常清楚地看到事物。」

研究人員利用 DeepMindAlphaFold2 模型和科技巨頭 Meta 開發的結構預測工具 ESMFold,為 458 種黃病毒物種的蛋白質生成了超過 33,000 個預測結構。ESMFold 基於經過數千萬個蛋白質序列訓練的語言模型

AlphaFold 不同,它只需要單個輸入序列,而不是依賴於來自類似蛋白質的多個序列,因此它可能對於研究最神秘的病毒特別有用。

圖片

圖示:丙型肝炎病毒糖蛋白結構預測。(來源:Spyros Lytras 和 Joe Grove)

預測的結構使作者能夠識別出與已知黃病毒序列截然不同的病毒入侵蛋白。他們發現了一些意想不到的聯絡。例如,包括丙型肝炎病毒在內的病毒亞群使用與他們在豬瘟病毒中發現的系統類似的系統感染細胞——豬瘟病毒包括引起豬出血熱的經典豬瘟病毒和其他動物病原體。

比較後顯示,該病毒的入侵系統與許多其他黃病毒的入侵系統不同。「對於丙型肝炎病毒及其近親,我們不知道其入侵系統來自何處。它可能是由這些病毒在很久以前『發明』的。」Grove 說。

從細菌中竊取

預測的結構還表明,寨卡病毒和登革熱病毒中研究透徹的入侵蛋白與 Grove 所說的基因組巨大的「奇怪而又奇妙」的黃病毒(包括可導致人類發燒的 Haseki 蜱病毒)具有相同的來源。另一個令人意外的是,一些黃病毒中似乎有一種從細菌中偷來的酶。

澳大利亞悉尼大學的病毒學家 Mary Petrone 表示:「這將是史無前例的。」要不是她的團隊今年在一種特別奇怪而又奇妙的黃病毒物種中發現了類似的盜竊行為,情況就更是如此。她補充道:「基因盜竊在塑造黃病毒進化方面發揮的作用可能比之前認為的更大。」

圖片

論文連結:https://www.pnas.org/doi/10.1073/pnas.2403805121

瑞士洛桑大學計算生物學家 David Moi 表示,黃病毒研究只是冰山一角,其他病毒甚至一些細胞生物的進化史很可能會被人工智慧改寫。「我們將用新一代工具重新講述它們的故事。」他說,「現在我們可以看得更遠一些,所有這些事情都必須進行一些更新。」

相關報導:https://www.nature.com/articles/d41586-024-02970-w

相關文章