文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破

AMiner學術頭條發表於2020-11-03
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破
近年來,自動化在化學領域的應用在一定程度上幫助化學家簡化了繁複的實驗研究,尤其是隨著人工智慧的發展,基於機器學習的 “AI化學家” 更是提升了實驗的效率和準確性,在化學研究領域釋放出更多紅利。

如今,來自英國格拉斯哥大學(University of Glasgow)Cronin 實驗室的化學家們在自動化化學合成領域取得了開拓性成果——他們開發了一個軟體,可以將學術論文轉化為可執行的程式,即實現了“文獻進,產物出(Paper in, product out)”的過程,且研究人員無需學習程式碼就可以編輯。

相關工作以 “A universal system for digitization and automatic execution of the chemical synthesis literature” 為題,線上發表在頂級科學期刊《科學》(Science)上。
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破圖 | Science 發表相關論文(來源:Science

“文獻進,產物出” AI 化學家引領化學數字化發展

早在 2018 年底,Cronin 團隊就研發了一個名為 “chemputer” 的化學計算機,該系統由試管、燒瓶、輸送化學物質的管道、閥門和泵等傳統化學實驗器皿組成,透過系統上執行的一套由化學描述語言(XDL,其中 “X” 的發音是 “kai”,取自希臘語中化學的第一個字母)編寫的程式,來控制化學分子的合成。去年,Cronin 團隊展示了該計算機可以生產多個分子的能力。如今,他們利用機器程式設計的便捷方式,再次向化學數字化領域邁出了重要一步。

這項工作的核心在於化學描述語言。對於該計算機而言,化學描述語言就像 HTML 對於瀏覽器一樣,它告訴機器該做什麼。
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破圖 | 用化學描述語言 XDL 編寫程式(來源:The Cronin Group 官網)該系統建立了一個名為 SynthReader 的軟體,它可以掃描經同行評審的文獻中的化學配方,比如生產瑞德西韋的 6 個步驟,並使用自然語言處理來挑選出“新增”、“攪拌”或“加熱”等動詞、“逐滴式”等修飾符,以及持續時間和溫度等一些其他細節,然後系統將這些指令轉換為化學描述語言,透過執行語言命令來驅動化學機器人在實驗室完成化合物的全自動合成。

近期剛被美國食品藥品監督管理局(FDA)批准可用於治療新冠住院患者的藥物瑞德西韋試驗就在這臺 chemputer 上高速執行著。前幾日,製造瑞德西韋藥物的吉利德公司宣佈,他們將在 10 月底前滿足全球對於瑞德西韋的需求,由此可見其生產效率之高。

論文作者之一 Cronin 介紹,該框架的優勢之在於化學家們可以用純英文編輯化學方案,因此無需培訓即可操作,還有至關重要的一點是,他們還可以利用化學專業知識來發現程式碼中的錯誤。

研究人員表示,他們從化學的相關文獻中提取了 12 種示範配方,其中包括麻醉劑利多卡因、Dess-Martin 高碘烷氧化劑和氟化劑 AlkylFluor。經測試,所有這些配方都是由 chemputer 以類似於人類化學家的效率進行操作的。

Cronin 表示:“如果我們有標準的方法來發現分子、製造分子,然後生產化學物質,突然間沒有什麼東西會被淘汰,這就像化學的電子書閱讀器。”

多年來,Cronin 一直夢想著未來研究人員可以像傳送電子郵件和列印 PDF 檔案一樣,輕鬆地分發和生產分子,從而使無法訂購藥物變得像無法找到現代文字一樣古老。

如今,越來越多的科研團隊都在競相將化學技術帶入數字時代,Cronin 團隊僅代表了跨越學術界和工業界的數十個小組之一,此次研究成果或將引領更安全的藥物生產、更高效的太陽能電池板,以及更具顛覆性的新型產業。

化學機器人推動製藥公司數字化轉型


如今,Cronin 創立了一家名為 Chemify 的公司,來銷售化學機器人 chemputer 和對應的 XDL 軟體包,他也在網上免費釋出了用於機器的搭建和程式設計的程式包。chemputer 已經在化學界取得了一定的進展,該團隊於去年 5 月在製藥公司葛蘭素史克(GSK )安裝了一臺原型機。

葛蘭素史克高階副總裁兼人工智慧機器學習全球負責人 Kim Branson 博士表示:“chemputer 這一概念的產生,以及 Cronin 團隊圍繞化學機器人所做的工作的確具有很大的變革性。”
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破
眾所周知,葛蘭素史克是一家以研發為基礎的藥品和保健品公司,其產品遍及全球市場。目前,該公司正在探索各種自動化技術,以提高生產效率。Branson 表示,Cronin 團隊正在進行的這項研究工作,可能會讓葛蘭素史克在公司內部更加方便地“傳輸專業知識”。一旦化學家設計出了一個有前景的分子配方,他們就不用再去寫報告或給同事講解,而是直接一鍵 “分享” 配方。

研究人員表示,儘管 Chemify 不是最複雜的自動化化學平臺,但它可能卻是最易於訪問的平臺。它是基於燒杯和試管這些傳統工具建立起來的,並在化學家們使用了幾個世紀的 “批次” 模式中逐步發揮作用。

如今,Cronin 團隊正在研究它的通用性(即與任何批處理化學機器人相容),研究人員只需要告訴軟體他們有哪些零件,並給它一些相應的溫度等數字,就可以讓機器執行。

AutoSyn 自動化學系統


此外,還有很多其他研究團體也在做一些打破傳統化學領域認知的研究。

SRI International 公司 SRI Biosciences 部門的首席戰略官 Nathan Collins 說:“與我們過去 200 年間所採用的的工作方式相比,大多數化學過程沒有什麼變化,都是一種純手工的、靠工匠驅動的過程,這一領域還有數十億美元的機會等待挖掘。”

今年 6 月,Collins 和他的同事們發表了一篇題為 “Fully Automated Chemical Synthesis: Toward the Universal Synthesizer” 的研究論文,描述了一種自動化多步化學合成儀 AutoSyn 進行藥物合成的研究。
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破圖 | AutoSyn的俯檢視文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破圖 | AutoSyn流動化學平臺中使用的單元操作模組(UOM)的順序示意圖文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破
圖 | 多步驟化學合成自動化
AutoSyn 平臺使用一種“流動”化學的方法,來替代傳統的物質混合方法。

以往,物質的混合首先需要將它們在一個燒杯中混合,然後再倒入另一個燒瓶,而 AutoSyn 平臺的物質混合過程則是當化學物質流經管子的時候,在這個動態過程中實現連續的化學反應。

AutoSyn 平臺具備 3000 多種合成途徑,可在幾小時內實現毫克級甚至是克級的任何藥物小分子的合成,幾乎可以複製所有型別的液體之間的反應。

Collins 說:“在流體中進行化學反應不僅需要專門的硬體,還需要一些額外的努力,才能從其批次說明中翻譯化學程式,從而實現傳熱和混合等方面的‘精妙’控制。如果像 AutoSyn 這樣的平臺可以針對已公開的反應自動執行數百種細微的變化,那麼它們生成的詳細資料集可能會突出顯示製造化學物質的最佳方法。”

這項工作可能是一個很好的起點,但許多已發表的實驗都存在缺陷。據 Collins 估計,化學家們會花費 30%-70% 的時間來解決已知反應中遺漏的細節。“進行一個化學反應,是需要研究人員根據之前的實驗記錄,坐下來逐步操作的。” Collins 說。

儘管 AutoSyn 和 chemputer 都能複製如今大部分已釋出的反應,但他們下一步需要讓機器變得更可靠,就像 Cronin 所說的那樣 “讓 Apple 變得時髦”。

Collins 說,我們過去需要一名工程師來維持 AutoSyn 一半以上的執行,但現在所需的修復時間不到 10%。他希望,最終可能實現使用者只透過電話就可以對系統進行故障排除。

Collins 表示:“這仍然是一門非常新的科學。過去 18 個月,它才開始真正爆發。”

Make-It

美國國防高階研究計劃局(DARPA)在推動這一科學發展的過程中發揮了重要作用,DARPA 剛結束了一項為期 4 年的 Make-It 專案,該專案的重點研究領域包括自動化分子設計、自動合成(生產)和快速反應篩選,在全自動快速分子生產領域取得重大進展。chemputer 和 AutoSyn 都是它的原型。

在過去,化學家們辛辛苦苦地將原子精加工成新穎的分子結構,需要一個漫長的等待過程。Make-It 專案的經理 Anne Fischer 的一個長期目標就是加快發現有用分子的過程,她說:“製造和測試分子始終是一個緩慢的步驟。”

但現在,Make-It 已經生產了 chemputer、AutoSyn 等製造分子的機器人工具,Fischer 正在指導一個新的 DARPA 專案“加速分子發現(Accelerated Molecular Discovery)”,該專案著眼於開發更智慧的軟體,來告訴機器人要製造什麼分子,以及如何製造。

Fischer 說:“我們現在正在嘗試擴充套件 Make-It 專案所做的工作,這樣我們就可以逐步教計算機去發現新的分子。”

許多人認為,我們實現這一過程的秘密武器是機器學習,其實一些能夠進行初級化學學習的機器還在研發中。

自動流動化學系統的持續改進

麻省理工學院的化學家 Connor Coley 所在的團隊去年將自動流動化學系統融合了一種演算法,以對其進行指導。該演算法在數十萬個反應的資料庫上進行了訓練,能夠預測新產品的配方。Coley 說:“基於這些模式,該系統試圖瞭解什麼樣的轉化方式應該適用於從未見過的新分子合成”。

Coley 還強調,該系統還有很長的路要走。它是基於相似的分子進行預測,而人類化學家還需要補充機器生成的輪廓中所缺失的細節。儘管如此,這項工作還是支援了軟體可以提出有用配方的概念。

麻省理工學院正在與十多家化學和製藥公司合作,以改進其分子預測演算法,並且一些公司已經將該軟體投入使用。默克公司(Merck)計算和結構化學助理副總裁 Juan Alvarez 表示,Coley 的機器學習演算法是該公司向其內部研究人員提供的多種化學預測工具之一。他說:“它的部署絕對會影響我們今天的時間表。”
文獻進,產物出!"AI化學家"顛覆傳統化學研究過程,有望在製藥行業激發變革性突破
雖然每個研究團隊都從不同角度探究自動化,但他們都在解決同一個問題。存在著近乎無限多種的分子,其中某些必定是可以拯救生命的藥物,或者是一些革命性的新材料,但很少有人擁有這方面的專業技能,來對這些化合物進行分析、製造和測試。

而這些化學自動化研究團隊的目標就是避免浪費那些稀有技能

在某些方面,化學家的工作仍然類似於抄寫員的工作,他們曾經費盡心思地複製和修正他人的著作。像 Cronin 這樣的研究人員,就是希望藉助相當於印刷機、文書處理器和自動更正機的化學制劑在手,未來的化學家們將花費更少的時間進行重複創作,轉而花費更多的時間進行新的創作。

Fischer 說:“這不是要取代化學家,而是要給化學家提供工具,讓他們成為有創造力的高階思考者。”

參考資料:
[1] Mehr, S., Craven, M., Leonov, A., Keenan, G. and Cronin, L., 2020. A universal system for digitization and automatic execution of the chemical synthesis literature. Science. <https://doi.org/10.1126/science.abc2986>
[2] Charlie Wood, 2020. Scientists make digital breakthrough in chemistry that could revolutionize the drug industry. CNBC. <https://www.cnbc.com/2020/10/24/how-a-digital-breakthrough-could-revolutionize-drug-industry.html>

相關文章