銅靈 發自 凹非寺
量子位 出品 | 公眾號 QbitAI
用AI進行藥物開發,可以省下2至3年的研發時間。
最新一期的Nature子刊上,就刊登了這樣一項新研究。
這項來自Insilico Medicine和藥明康德等機構的AI演算法,21天內就能夠設計出潛在分子架構,並在46天內完成初步生物學驗證。
也就是說,單從研發過程來看,AI 46天設計系統,距離真正可用的藥物問世,只有臨床驗證這臨門一腳。
據《連線》報導,這種新方法比傳統制藥公司的研發過程快15倍。
藥明康德做了一筆計算,這個系統能省下數月到數年的研發時間,省下幾十億美元的高昂研發開支。
省時省力還省錢,自然也就獲得了更多認可。
哈佛大學的系統生物學家Mohammed AlQuraishi評價說,這項工作向前邁出了一大步,表明其AI可以定製,不僅能與特定目標結合,而且能造出在細胞和動物體內表現良好的分子。
這是製藥公司希望看到的,論文一作Alex Zhavoronkov 說。
目前,這個登上Nature子刊的研究也開源了。
DDR1為目標靶點
在論文Deep learning enables rapid identification of potent DDR1 kinase inhibitors中,研究人員詳細描述了整個實驗過程。
研究人員將DDR1設為目標靶點。
據合肥物質科學研究院此前資料顯示,這是一種與細胞增殖、分化、粘附、遷移和侵襲等多種細胞功能有關的受體酪氨酸激酶。
此前研究顯示,DDR1激酶的過度表達和功能獲得性突變可增加腫瘤模型動物的致瘤性,而敲除DDR1激酶的基因會抑制腫瘤的發生和轉移,因此,DDR1激酶很有可能是一個抗癌症藥物開發的靶點。
為了找出DDR1激酶抑制劑,研究人員開發了新的AI模型, GENTRL(generative tensorial reinforcement learning,生成張量強化學習模型)。
△ GENTRL模型架構圖(圖片來自Nature官網)
研究人員選擇了6個不同資料集訓練模型,6個資料集各有側重,包含已確定的DDR1激酶抑制劑和3D結構,激酶抑制劑的常見分子結構、無靶向激酶分子結構等。
研究人員用資料集,用強化學習的方法訓練模型後,初步得到近30000個不同的DDR1激酶抑制劑結構。
從確定靶點到篩選出最具潛力結構的整個過程,研究人員 只用了21天。
這只是初步的篩選結果,隨後,研究人員從中隨機挑選40種結構,進行RMSD化學空間分佈檢測。
結果顯示,其中的39個都是此前的專利或者研究中沒有提到的全新結構。
他們又挑出了六種結構,進行生物體外和體內的進一步實驗。體外實驗結果顯示,4種結構在初始測試中顯示出成為藥物的潛質,2種結構對DDR1有很高的抑制性,且能降低與纖維化程式有關的標誌物。
在動物身上進行實驗後(沒錯,躺槍的還是小白鼠),研究人員證明了篩選出的DDR1激酶抑制劑分子對目標蛋白質都有效,藥代動力學特徵良好,初步生物學驗證透過。
從確定靶點到透過初步生物學驗證,GENTRL模型只用了 46天的時間,就完成了傳統方法數月到數年的研究。
不過,Zhavoronkov表示,GENTRL生成的藥物還需要進行臨床實驗,距離真正以一種新型藥物的姿態問世,還需要幾年時間。
AI大 法好
AI在生物化學領域,早就已經嶄露頭角了。
DeepMind去年公佈了生物學界的AlphaGo——AlphaFold,只要知道蛋白質的氨基酸序列,就可以預測蛋白質分子的三維摺疊結構。
它僅僅基於蛋白質的基因序列,就能預測蛋白質的3D結構,而且結果比以前的任何模型都要精確。
在“蛋白質結構預測奧運會”CASP比賽中,力壓其他97個參賽者。《衛報》報導稱,AlphaFold預測出了43種蛋白質中25種蛋白質的最精確結構。
今年,MIT把AI的預測能力又推進了一步,直接透過氨基酸序列預測蛋白質分子的生物學功能,跳過AlphaFold預測蛋白質立體結構的步驟。
對於某個氨基酸序列,該模型將為3D結構中的每個氨基酸位置產生一個嵌入表示。機器學習模型根據這些嵌入,基於接觸圖準確預測每個氨基酸的功能。
研究人員使用該模型預測哪些蛋白質可以透過細胞膜,所得結果的準確性已經超過之前最先進的模型。
格拉斯哥大學的研究人員訓練出了一個人工智慧驅動的有機化學合成機器人,這套機器人系統包含一系列泵和反應器,並與質譜儀、核磁共振光譜儀及紅外光譜儀等儀器連線到一起,使探索大量化學反應的過程實現自動化。
傳送門
Nature論文地址:
GitHub地址:
— 完 —