如今,來自英國格拉斯哥大學(University of Glasgow)Cronin 實驗室的化學家們在自動化化學合成領域取得了開拓性成果——他們開發了一個軟體,可以將學術論文轉化為可執行的程式,即實現了“文獻進,產物出(Paper in, product out)”的過程,且研究人員無需學習程式碼就可以編輯。
相關工作以 “A universal system for digitization and automatic execution of the chemical synthesis literature” 為題,線上發表在頂級科學期刊《科學》(Science)上。
“文獻進,產物出” AI 化學家引領化學數字化發展
這項工作的核心在於化學描述語言。對於該計算機而言,化學描述語言就像 HTML 對於瀏覽器一樣,它告訴機器該做什麼。
該系統建立了一個名為 SynthReader 的軟體,它可以掃描經同行評審的文獻中的化學配方,比如生產瑞德西韋的 6 個步驟,並使用自然語言處理來挑選出“新增”、“攪拌”或“加熱”等動詞、“逐滴式”等修飾符,以及持續時間和溫度等一些其他細節,然後系統將這些指令轉換為化學描述語言,透過執行語言命令來驅動化學機器人在實驗室完成化合物的全自動合成。
近期剛被美國食品藥品監督管理局(FDA)批准可用於治療新冠住院患者的藥物瑞德西韋試驗就在這臺 chemputer 上高速執行著。前幾日,製造瑞德西韋藥物的吉利德公司宣佈,他們將在 10 月底前滿足全球對於瑞德西韋的需求,由此可見其生產效率之高。
論文作者之一 Cronin 介紹,該框架的優勢之一在於化學家們可以用純英文編輯化學方案,因此無需培訓即可操作,還有至關重要的一點是,他們還可以利用化學專業知識來發現程式碼中的錯誤。
研究人員表示,他們從化學的相關文獻中提取了 12 種示範配方,其中包括麻醉劑利多卡因、Dess-Martin 高碘烷氧化劑和氟化劑 AlkylFluor。經測試,所有這些配方都是由 chemputer 以類似於人類化學家的效率進行操作的。
Cronin 表示:“如果我們有標準的方法來發現分子、製造分子,然後生產化學物質,突然間沒有什麼東西會被淘汰,這就像化學的電子書閱讀器。”
多年來,Cronin 一直夢想著未來研究人員可以像傳送電子郵件和列印 PDF 檔案一樣,輕鬆地分發和生產分子,從而使無法訂購藥物變得像無法找到現代文字一樣古老。
如今,越來越多的科研團隊都在競相將化學技術帶入數字時代,Cronin 團隊僅代表了跨越學術界和工業界的數十個小組之一,此次研究成果或將引領更安全的藥物生產、更高效的太陽能電池板,以及更具顛覆性的新型產業。
化學機器人推動製藥公司數字化轉型
葛蘭素史克高階副總裁兼人工智慧和機器學習全球負責人 Kim Branson 博士表示:“chemputer 這一概念的產生,以及 Cronin 團隊圍繞化學機器人所做的工作的確具有很大的變革性。”
研究人員表示,儘管 Chemify 不是最複雜的自動化化學平臺,但它可能卻是最易於訪問的平臺。它是基於燒杯和試管這些傳統工具建立起來的,並在化學家們使用了幾個世紀的 “批次” 模式中逐步發揮作用。
如今,Cronin 團隊正在研究它的通用性(即與任何批處理化學機器人相容),研究人員只需要告訴軟體他們有哪些零件,並給它一些相應的溫度等數字,就可以讓機器執行。
AutoSyn 自動化學系統
SRI International 公司 SRI Biosciences 部門的首席戰略官 Nathan Collins 說:“與我們過去 200 年間所採用的的工作方式相比,大多數化學過程沒有什麼變化,都是一種純手工的、靠工匠驅動的過程,這一領域還有數十億美元的機會等待挖掘。”
今年 6 月,Collins 和他的同事們發表了一篇題為 “Fully Automated Chemical Synthesis: Toward the Universal Synthesizer” 的研究論文,描述了一種自動化多步化學合成儀 AutoSyn 進行藥物合成的研究。
以往,物質的混合首先需要將它們在一個燒杯中混合,然後再倒入另一個燒瓶,而 AutoSyn 平臺的物質混合過程則是當化學物質流經管子的時候,在這個動態過程中實現連續的化學反應。
AutoSyn 平臺具備 3000 多種合成途徑,可在幾小時內實現毫克級甚至是克級的任何藥物小分子的合成,幾乎可以複製所有型別的液體之間的反應。
Collins 說:“在流體中進行化學反應不僅需要專門的硬體,還需要一些額外的努力,才能從其批次說明中翻譯化學程式,從而實現傳熱和混合等方面的‘精妙’控制。如果像 AutoSyn 這樣的平臺可以針對已公開的反應自動執行數百種細微的變化,那麼它們生成的詳細資料集可能會突出顯示製造化學物質的最佳方法。”
這項工作可能是一個很好的起點,但許多已發表的實驗都存在缺陷。據 Collins 估計,化學家們會花費 30%-70% 的時間來解決已知反應中遺漏的細節。“進行一個化學反應,是需要研究人員根據之前的實驗記錄,坐下來逐步操作的。” Collins 說。
儘管 AutoSyn 和 chemputer 都能複製如今大部分已釋出的反應,但他們下一步需要讓機器變得更可靠,就像 Cronin 所說的那樣 “讓 Apple 變得時髦”。
Collins 說,我們過去需要一名工程師來維持 AutoSyn 一半以上的執行,但現在所需的修復時間不到 10%。他希望,最終可能實現使用者只透過電話就可以對系統進行故障排除。
Collins 表示:“這仍然是一門非常新的科學。過去 18 個月,它才開始真正爆發。”
Make-It
在過去,化學家們辛辛苦苦地將原子精加工成新穎的分子結構,需要一個漫長的等待過程。Make-It 專案的經理 Anne Fischer 的一個長期目標就是加快發現有用分子的過程,她說:“製造和測試分子始終是一個緩慢的步驟。”
但現在,Make-It 已經生產了 chemputer、AutoSyn 等製造分子的機器人工具,Fischer 正在指導一個新的 DARPA 專案“加速分子發現(Accelerated Molecular Discovery)”,該專案著眼於開發更智慧的軟體,來告訴機器人要製造什麼分子,以及如何製造。
Fischer 說:“我們現在正在嘗試擴充套件 Make-It 專案所做的工作,這樣我們就可以逐步教計算機去發現新的分子。”
許多人認為,我們實現這一過程的秘密武器是機器學習,其實一些能夠進行初級化學學習的機器還在研發中。
自動流動化學系統的持續改進
Coley 還強調,該系統還有很長的路要走。它是基於相似的分子進行預測,而人類化學家還需要補充機器生成的輪廓中所缺失的細節。儘管如此,這項工作還是支援了軟體可以提出有用配方的概念。
麻省理工學院正在與十多家化學和製藥公司合作,以改進其分子預測演算法,並且一些公司已經將該軟體投入使用。默克公司(Merck)計算和結構化學助理副總裁 Juan Alvarez 表示,Coley 的機器學習演算法是該公司向其內部研究人員提供的多種化學預測工具之一。他說:“它的部署絕對會影響我們今天的時間表。”
而這些化學自動化研究團隊的目標就是避免浪費那些稀有技能。
在某些方面,化學家的工作仍然類似於抄寫員的工作,他們曾經費盡心思地複製和修正他人的著作。像 Cronin 這樣的研究人員,就是希望藉助相當於印刷機、文書處理器和自動更正機的化學制劑在手,未來的化學家們將花費更少的時間進行重複創作,轉而花費更多的時間進行新的創作。
Fischer 說:“這不是要取代化學家,而是要給化學家提供工具,讓他們成為有創造力的高階思考者。”
參考資料: