從300億分子中篩出6款,結構新且易合成,史丹佛抗生素設計AI模型登Nature子刊

ScienceAI發表於2024-04-01

圖片

編輯 | 凱霞

全球每年有近 500 萬人死於抗生素耐藥性,因此迫切需要新的方法來對抗耐藥菌株。

AI 方法可以發現新的抗生素,但現有方法有明顯的侷限性。性質預測模型很難擴充套件到大型化學空間。直接設計分子的生成模型可以快速探索廣闊的化學空間,但生成的分子難以合成。

在此,史丹佛大學和麥克馬斯特大學(McMaster University)的研究人員發明了一種新的生成式 AI 模型 SyntheMol,可以設計數十億種新的抗生素分子,這些分子價格低廉且易於在實驗室中合成。

SyntheMol 可以從近 300 億個分子的化學空間中設計易於合成的新化合物。該模型可以設計新的抗生素來阻止鮑曼不動桿菌的傳播。發現 6 個結構新穎的分子表現出對鮑曼不動桿菌的抗菌活性。

論文作者、史丹佛大學生物醫學資料科學副教授 James Zou 說,「SyntheMol 不僅設計了有希望的候選藥物的新穎分子,而且還生成了如何製造每種新分子的配方。」

全球健康藥物研發中心(GHDDI)首席科學官張儒民博士表示:「生成式 AI 模型 SyntheMol 在短短三個月之內,設計出六款活性不錯(當然有待進一步改進)的結構新穎且易於合成的抗生素候選分子。我們因此有理由樂觀地預期,在不遠的將來,AI 必將大幅提升製藥成功率,縮短製藥週期,降低研發成本,更快造福人類。」

相關研究以《Generative AI for designing and validating easily synthesizable and structurally novel antibiotics》為題,於 2024 年 3 月 22 日釋出在《Nature Machine Intelligence》上。

圖片

論文連結:https://www.nature.com/articles/s42256-024-00809-7

耐藥細菌在全球範圍內的傳播迫切需要新的抗生素,但即使是現代 AI 方法在分離有希望的化合物方面也受到限制,特別是當研究人員還必須找到製造這些新的 AI 引導藥物並在實驗室中測試它們的方法時。

眾所周知,鮑曼不動桿菌很難根除,可引起肺炎、腦膜炎和傷口感染,所有這些都可能導致死亡。世界衛生組織已將鮑曼不動桿菌確定為世界上最危險的耐抗生素細菌之一。但幾乎沒有什麼治療選擇。

該論文的第一作者,麥克馬斯特大學生物醫學與生物化學系助理教授 Jonathan Stokes 說,「抗生素是一種獨特的藥物。一旦我們開始在臨床上使用它們,我們就會在藥物失效之前開始計時,因為細菌會迅速進化以抵抗它們。我們需要強大的抗生素管道,需要快速且廉價地發現它們。這就是 AI 發揮關鍵作用的地方。」

SyntheMol 設計出 6 個結構新穎且易於合成的抗生素分子

研究人員開發了生成模型,可以快速、廉價地獲取數百億個有希望的分子。

SyntheMol 使用蒙特卡洛樹搜尋(MCTS),從包含 132,000 個分子片段的庫中提取資料,這些片段像樂高積木一樣拼湊在一起,但本質上卻截然不同。

然後,他們將這些分子片段與一組 13 個化學反應進行交叉引用,使其能夠識別 300 億個片段的雙向組合,從而設計出具有最有希望的抗菌特性的新分子。

圖片

圖示:SyntheMol 模型。(來源:論文)

研究訓練 SyntheMol 來設計對鮑曼不動桿菌具有抗生素活性的分子,合成並透過實驗驗證了所生成的 58 個分子。

該模型設計的每個分子依次透過另一個經過訓練來預測毒性的人工智慧模型。該過程產生了六種分子,它們對鮑曼不動桿菌具有有效的抗菌活性,而且無毒。

圖片

圖示:生成式 AI 用於抗生素發現。(來源:論文)

科學家們能夠進一步測試六種化合物中的兩種對小鼠的毒性,因為其他四種不溶於水。他們測試的兩個似乎是安全的;下一步是在感染鮑曼不動桿菌的小鼠身上測試這些藥物,看看它們是否在活體中起作用。

難得一見的 10% 高成功率

張儒民博士認為,該研究有至少如下幾個可資學習的亮點:

(1)作者首先實測了一萬多種化合物對鮑曼不動桿菌的抑菌活性,用這些可靠資料訓練「活性預測」模型。這是非常必要的、紮紮實實的基本功。

(2)從頭就著眼於「易於合成、結構新穎的小分子」,使用常見的 13 個化學反應和 132,000 個小分子構建塊,可以虛擬搭建高達近 300 億個易於合成的小分子。當然,絕大多數化合物並不具有生物活性。

(3)用生成式人工智慧 SyntheMol 模型,基於上述實測資料的「活性預測」建模,在短短八個半小時內完成的 20,000 次迭代分子生成中,設計出近 3,000 款預期具有抗菌活性的候選分子(其中三分之一在頭 2,000 次迭代中即生成了)。

(4)最後遴選出 58 個新穎、多元、預測有高活性的分子,並在實驗室實際合成出來。其中 6 個分子有相當好的廣譜抗菌活性,且有足夠低的耐藥機率。這代表了難得一見的 10% 高成功率!

圖片

圖片

圖示:生成模型開發。(來源:論文)

張儒民博士補充道:「該研究也存在一定侷限性,SyntheMol 模型還不能一步或寥寥幾步到位,快速最佳化設計最後具備完整成藥性的、可推到人體臨床試驗的新穎藥物分子。AI 賦能製藥的科技革命尚未成功,藥業同仁仍需努力。」

研究人員也正在改進 SyntheMol 並擴大其範圍。他們正在與其他研究小組合作,利用該模型來發現治療心臟病的藥物,併為實驗室研究創造新的熒光分子。

參考內容:https://phys.org/news/2024-03-artificial-intelligence-superbug-antibiotics.html

https://techxplore.com/news/2024-03-generative-ai-potential-drugs-antibiotic.html

注:封面來自網路。

相關文章