當AI開始尋找抗生素:人類終於摘取“高懸的果實”?

naojiti發表於2020-03-10

抗生素帶給人類的福澤,無論給出多少溢美之詞都不過分。抗生素在應用初期,被人們認為是幾乎“包治百病”的靈丹妙藥,成為20世紀人類最偉大的成就之一。

(圖題:感謝青黴素,給我回家路)

然而到了今天,全球每年約有50%的抗生素被濫用,在中國這一比例甚至接近80%。家有兒女的人們恐怕更有切身體驗,只要孩子頭疼腦熱總要上醫院打點滴,大多里面都使用了抗生素。人們對於“見效快”的執念所造成的直接後果就是讓細菌更具抗藥性,可能以往發揮作用的抗生素,會因為細菌抗藥性的增加而失效。

對於抗生素寄予厚望的普通人可以會想:科學家只要找到比產生抗藥性細菌的更強的抗生素就可以了。事實上科學家們確實是這麼幹,但抗生素的研究遠非人們想象中那麼簡單。

那對更心急、更痴迷“銀彈思維”的吃瓜群眾來說,總是還想打破砂鍋地問一句:有沒有可能找到一種有效消滅大量有害細菌的抗生素呢?從生物規律上來講,這有點痴心妄想。但目標總是要有的,萬一接近了呢?

求瓜得瓜。2月20日,全球著名的自然科學類期刊《細胞》(Cell)發表了一篇題為“一種發現抗生素的深度學習方法”的研究論文,報導了麻省理工學院(MIT)的研究團隊利用深度學習模型發現了一種超強抗生素——Halicin。經試驗研究,這種新型抗生素化合物對多種耐藥菌有殺菌效果,具有廣譜抗菌效應。當然這一研究的亮點在於新的研究方法,即透過AI的深度學習演算法從大型合成化學分子庫中找到了這一獨特的分子結構。

AI在藥物研發上面的能力已經不是什麼稀罕事,但發現抗生素還是第一次。好奇心一定會驅使我們繼續追問下去:為什麼人類研發抗生素的速度抵不過細菌抗藥性的增長速度?AI開拓出抗生素研發的路徑對於醫學來說又意味著什麼?

抗生素發現的謎題,為什麼人類的路越走越窄?

從1928年,弗萊明發現第一種抗生素——青黴素起幾十年間,此後科學家們又陸續發現了100多種抗生素。但從1987年起一直到2015年,整整28年間,人類卻再也沒有發現新的抗生素。

為什麼新型抗生素的發現越來越慢,甚至出現瞭如此長的一段空檔期?可以說,我們目前所使用的主要的幾種抗生素都是四五十年代發現,且都是從土壤中的微生物種群中篩選和培養。大約99%的細菌種群之前是無法在實驗室中單獨培養,這一限制條件讓人們無法單獨分離出細菌生產的潛在的有效的抗生化合物。

從上世紀60年代以後,從微生物種群中尋找新的抗生素的速度明顯放緩,取而代之的是“半合成抗生素”。如今以青黴素、頭孢菌素為主體的β一內醯胺類抗生素,已經成為最主要的化學治療藥劑。

一直到2015年,美國科學家才發現了一種新型抗生素——泰斯巴汀(Teixobactin)。這一抗生素實現了抗菌藥物領域的一大突破,可以殺死多種致命病原體,同時病原體很難對其發展出抗藥性。這一科學進展得益於細菌培育技術的進步。研究人員透過一種稱為iChip的電子晶片裝置,可以將目標細菌分離並分別在比實驗室更自然的土壤環境中生長,從而讓只有1%成長機會的細菌提升到50%。

儘管如此,發現新的抗生素的效率仍然還是太低了,而且經過大規模投入培養出的抗生素很可能還是舊的抗生素,或者不具有很好的抗菌活性。那這次為什麼AI就能做到呢?

窺斑見豹:新型抗生素探尋的AI新路徑

由於傳統的抗生素藥物培育的低效,從大型合成化學文庫的篩選抗生素分子結構成為一種新思路。但這些文庫可能包含幾十萬到幾百萬個化學分子,但分子式的化學多樣性有限,且無法反映抗生素分子可能的化學性質。一來是人工篩選的工作量極大成本過高,再則是面臨難以驗證化合物多樣性的限制。

從分子庫中篩選對某種細菌能夠產生抑制性的分子,再去驗證這些分子與已經應用的抗生素的差異。其中包括了海量的計算與重複實驗,讓這一辦法對於人類研究者確實太不友好了。

但這次,AI作為一種新的研究手段引入對這些合成化學分子的篩查,讓發現抗生素引來重大轉機。研究人員提出了將結構分析和篩選相結合的思路,利用機器學習演算法從分子性質中預測具有潛在抗菌效能的化合物。這一次大獲成功。

首先,研究者以抑制某種大腸桿菌為目標進行篩選,選取了2335種FDA已經批准的藥物分子或自然化合物分子,再以80%生長抑制率為標準,將它們分為有抑菌性和沒有抑菌性兩類,作為神經網路的訓練資料集。

同時,他們採用了一種“有向訊息傳遞深度神經網路”(DMP-DNN)的演算法,將化合物的原子和成鍵等資訊以連續向量的方式多次重複傳遞,從而獲取更高階的表徵結果。這一神經網路是透過自學習向量來表徵分子,而不需要人為標註特定的分子結構。

有向資訊傳遞網路能直接從分子的圖結構預測分子的屬性,經過固定次數的資訊傳遞步驟,最終形成的分子的單個向量就可以進行對細菌的抑制率的預測。這種窺斑見豹的方式,大大的縮短了篩選路徑,也降低了對於算力、時間等等成本的消耗。

(除了銅綠假單胞菌(底部藍色)外,Halicin在幾種耐藥菌測試中,顯示了良好的廣譜抗菌活性)

隨後,將訓練過的深度學習模型應用到博德研究所的包含約1億分子量的DRH化合物庫中進行篩選,該模型從6111個正處於研究階段的藥物分子裡,選出了99種最有可能存在抑菌性的化合物。

最後,經過實驗結果證實,其中的51種能明顯抑制該類大腸桿菌生長。從中選出了這種被命名為Halicin的化合物,因其低體內毒性和結構新穎性,成為最有潛力的新型抗生素。

此後研究者將在再次訓練過的深度學習模型應用在了規模更大的ZINC15藥物小分子資料庫上,對約一億化合物的預測和篩選,又發現了新的潛在的抗生素結構。而這一篩選過程,也僅僅只用了三天。

可見在深度學習的幫助下,6111個藥物分子被篩選成99個,對這99個藥物分子再進行試驗,效率自然快得多。

這一開創性研究標誌著抗生素發現乃至更普遍的新藥挖掘方法發生了正規化轉變。那AI的加入到底會帶來哪些更多的價值呢?

抗生素新藥研發的戰場,AI正全軍出擊

一般來說,傳統的藥物的研發主要經歷這四個階段:

1、靶點的選擇和確認;2、先導化合物的發現和最佳化;3、臨床前研究;4、臨床試驗。之後才可以正式被批准上市。一款新藥從研發到上市面臨3個“10”的考驗:10年時間、10億美金、10%成功率,而且這一趨勢更為嚴重。對於抗生素的研發,也面臨著同樣的長時間高投入、低產出低利潤的問題。

在AI特別是深度學習演算法的幫助下,藥物研發正在迎來新的轉機。從目前AI已經在投入應用的新藥研製,以及這一次AI在新的抗生素化合物分子的發現上,都表現出非常明顯的效果。可以說,未來AI在新藥物挖掘、化合物篩選、靶點發現和藥物有效性預測等方面都將起到極大的輔助作用,一定程度上提高研發效率、節約資金以及降低臨床試驗的失敗風險。

現代藥物研發首先最關鍵的就是藥物標靶的尋找和識別。藥物靶點是指藥物在體內的作用結合位點,包括基因位點、受體、酶、離子通道、核酸等生物大分子。選擇確定新穎的有效藥靶是新藥開發的首要任務。引入AI技術之前,傳統抗生素作用新靶點的篩查基於基因組、抑制蛋白質合成、合成酶等方法,其困難在於人工篩選試驗效率低下,進展緩慢。而透過AI的深度學習模型的介入,可以更快地數以千萬計的科學文獻的非結構資料以及這些生物的基因分子中找到可能合適的靶點。再透過選擇不同的靶點並進行驗證,以瞭解靶點的生物學特性,實時互動得到有證據的結果,實現相應藥物靶點的發現。

再則,AI在新藥物的化合物篩選上面也同樣高效而準確。此次Halicin這一高活性化合物發現,正是根據具體的藥物靶向需求,採用靈活的模型演算法,在數千種可能的分子合成物中有效篩選可能的藥物分子結構,極大節省了篩選時間和成本。

另外,除了在新藥物靶點發現以及高活性化合物的發現外,AI在小分子藥物自動合成路線的設計、新藥物效果模擬和預測,甚至新型藥物分子的預測上面都有實際應用的實踐。這對於無論是抗生素藥,還是更普遍的藥物的研發都將帶來巨大的契機。

在新藥研發領域有一個形象的說法,那些“低垂的果實“都已經被摘完了,未來的新藥研發需要去被茂密的樹枝和樹葉阻擋的果樹高處去摘取果實。而AI可能正是抵達這些樹枝身處摘取果實的最好階梯。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2679358/,如需轉載,請註明出處,否則將追究法律責任。

相關文章