兩年前,將人工智慧(AI)用於藥物研發的初創公司只有30家左右,而現在這個數目已經飆升到了148家。這一統計雖然還不完全,但是它反映了AI在藥物研發中的迅猛發展。今年,美國著名的矽谷銀行(Silicon Vally Bank, SVB)第一次推出了對數字健康領域的投資統計,在今年上半年,對這一領域的投資已達到52.6億美元,超過了2017年全年的投資總數,2019年全年投資總數有望超過100億美元!可以說,AI技術的成熟出現在醫藥產業發展的關鍵節點上,由於新藥物靶點和作用機制越來越少,醫藥公司需要更多的投入和精力才能產出和以前相當的“first-in-class”藥物。克服這一障礙的方法包括提升研發效率,和深耕已有資料來發現新的洞見。AI在這兩個方面都可以大展身手。
然而,業界資深人士也表示,在AI迅猛發展的同時,我們需要警醒AI的研究方向是否走偏了。對AI能力的過度炒作可能會為這一領域帶來“AI的冬天”。今天藥明康德內容團隊將結合公開資料,探討AI在藥物研發中的潛力和侷限。圖片來源:Pixabay理解複雜的規則
給予足夠多的資料,機器學習演算法能夠從中發現規律,然後利用這些規律來作出預測或者對新的資料進行分類。它們在這方面的表現遠遠快於任何人類。當代的藥物研發團隊面對的挑戰是需要系統性地對海量資料進行分析,這些挑戰已經不是可以單靠人腦來完成的工作。AI尤其擅長處理應用複雜的規則對大量資料進行分析。麻省理工學院(MIT)電腦科學家,楊森(Janssen)公司的科學顧問Regina Barzilay博士表示:“例如,當我們在學習化學的時候,我們學習了很多規則並且理解了化學反應的機制,然而有些時候,這些規則非常非常的複雜。如果我們能夠為計算機演算法提供很多資料,並且將需要解決的問題正確地呈現出來,它們有可能捕捉到人類無法捕捉到的規律。“以藥物毒性為例,在過去50年裡,世界範圍內有超過450款藥物在獲批上市之後因為毒副作用撤市,其中肝臟毒性是最常見的原因。例如在1993年上市的治療皮膚真菌感染的特比萘芬(terbinafine)在上市之後被發現可能導致肝臟毒性。截至2008年,已經有3例因為肝功能衰竭而死亡的病例和70例其它肝臟毒性被證明是由於特比萘芬造成的。然而,藥物在肝臟中的代謝過程非常複雜,也非常難於預測。這是機器學習可能幫助解決的典型問題,而且我們已經擁有了訓練AI的資料。美國聯邦政府的Tox21專案,通過美國環保局(EPA)、國家衛生研究院(NIH)和FDA的合作,構建了一個包含大量分子和它們對人類關鍵性蛋白毒性的資料庫。這一資料庫可以被用來訓練AI,發現化合物結構、特徵和功能與可能出現的毒副作用之間的關係。名為Cloud Pharmaceuticals的生物技術公司已經將這些資料整合到該公司的化合物篩選過程中。這家公司去年與大型藥企葛蘭素史克(GSK)達成一項研發合作協議。“使用這一資料集訓練機器學習演算法之後,當新分子出現時,AI能夠預測它是不是會具有毒性。”Cloud公司聯合創始人兼首席科學官Shahar Keinan博士說。除了發現潛在毒性以外,機器學習演算法還可以預測候選化合物在不同物理和化學環境下的反應,從而幫助藥物研發人員理解它們在人體不同組織中的行為。滑鐵盧大學(University of Waterloo)的物理化學家Scott Hopkins博士正在與輝瑞(Pfizer)公司合作,訓練演算法來評估候選分子吸收或者丟失水份的能力。“如果一個藥物分子非常迅速地吸收水份並且不會讓水份流失,這意味著這種藥物在水中很容易溶解,”Hopkins博士說:“它在胃中會很快溶解並且進入血液迴圈。”這一演算法通過分析89種小分子候選藥物結構與可溶性的關係,能夠準確預測出類似分子的關鍵性特徵。這項研究已經在Nature Communications上發表。對藥物潛在毒性和生化特徵的篩查雖然是藥物開發中不可缺少的步驟,但是對於AI研究人員來說,在藥物研發中的“聖盃”是從頭生成一個新治療性分子的結構。藥明康德的合作伙伴Insilico Medicine公司,正在使用稱為“生成對抗網路“(generative adversarial network, GAN)來開發全新的小分子化合物,治療癌症、代謝性疾病和神經退行性疾病等嚴重疾病。這一演算法由兩個互相對抗的深度神經網路構成。第一個深度神經網路的任務是根據一系列化合物應該具有的功能和生化特徵標準(例如溶解性、靶點,或者生物利用度),生成分子結構。而另一個深度神經網路的作用是對第一個神經網路輸出的結構進行“批評“。“它們之間在相互競爭,“Insilico公司執行長Alexander Zhavoronkov博士說:”經過無數次的迭代,它們能夠學會生成一些全新的結構。“Insilico公司計劃針對多個孤兒藥靶點開發候選藥物分子。人工智慧的侷限性
雖然人工智慧在藥物開發領域取得了很大的進步,但是它們還無法取代人類的作用。AI在藥物開發中的作用就像一個智慧廚房。“你可以有智慧微波爐、咖啡機和其它智慧工具,但是它們都沒法為你做出一道晚餐,“Barzilay博士說:”你需要將這些工具整合在一起來做出一道晚餐,它們只能夠幫助你做的更快更好。“AI的表現受到輸入資料質量的限制。在今年的藥明康德全球論壇上,業界的專家也表示,很多時候,用於訓練機器學習演算法的高質量資料並不存在。而低質量的資料可能導致演算法從資料中獲取虛假的訊號,導致了“垃圾進,垃圾出“的擴大化。 現今存在的公開資料往往由於格式、代表性等多種原因,無法成為高質量的資料。對於有的AI藥物研發公司來說,解決這一難題的辦法是自己生成高質量的資料。例如,insitro和Recursion公司都在根據解決特定問題的需求,生成自己的資料。而對於Gary Marcus博士來說,他的擔憂是對AI能力的過度炒作可能帶來與實際不符的期望值。而看看AI開發的歷史就可以看到,AI領域的開發已經在1974-1980年,和1987-1994年,經歷過了兩個發展的“冬天“。由於期望不能夠得到實現,AI研究的政府和私人投資都大幅度減少。▲Gary Marcus博士(圖片來源:Gary Marcus博士個人網站)Gary Marcus博士是紐約大學心理學和神經科學教授,也是機器學習初創公司Geometric Intelligence的創始人和執行長。在他看來,深度學習(deep learning)是非常出色的演算法工具,然而它相當於一種超級記憶。能夠把所有想知道的東西都記下來當然不是件壞事,但是當遇到不常見的情況時,它缺乏靈活性,表現並不算好。
他擔心的是,我們過於依賴深度學習這一種人工智慧的構架。即便深度學習是一個完美的“錘子”,但是在醫藥領域需要解決的問題卻不全是“釘子”。試圖使用一種工具來解決所有問題是不恰當的,面對需要解決的問題的多樣性,我們也需要有更為靈活和細緻入微的思考方式。基因泰克研發掌門人Michael Varney博士也在日前的訪談中表現出對人工智慧過度炒作的憂慮。雖然業界人士表示,使用人工智慧在藥物研發方面的應用存在著過度的炒作,但是他們仍然對人工智慧可能帶來的可能性非常興奮。無論是Marcus博士還是Varney博士,都在積極開發和使用人工智慧工具,協助新藥研發的過程。“如果能夠將藥物發現的效率提高5倍到10倍,從經濟學角度上講,研究人員可以探索更具風險的研發專案,因為失敗的成本大大降低了。“華盛頓大學(Washington University)的S. Joshua Swamidass博士說。他帶領的團隊使用機器學習,最終在2018年解開了特比萘芬導致肝臟毒性之謎。”想像一下,那樣我們可以有能力探索多少種難治疾病的創新療法!參考資料
[1] Artificial Intelligence Shakes Up Drug Discovery. Retrieved August 24, 2019, from https://www.the-scientist.com/bio-business/artificial-intelligence-shakes-up-drug-discovery-65787
[2] AI startups are racing into drug development. Here’s 5 burning questions about which will survive. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/22/artificial-intelligence-drug-development-startups-growth/
[3] Machine learning brings cell imaging promises into focus. Retrieved August 24, 2019, from https://www.nature.com/articles/d41573-019-00144-2
[4] Bera et al., (2019). Artificial intelligence in digital pathology — new tools for diagnosis and precision oncology. Nature Reviews Clinical Oncology, https://doi.org/10.1038/s41571-019-0252-y
[5] Warning of an AI winter, a skeptic argues deep learning in medicine needs a reboot. Retrieved August 24, 2019, from https://www.statnews.com/2019/08/21/ai-winter-deep-learning-oversold-in-medicine/