Transformer革新藥物研發:TRACER框架實現反應感知的分子設計與合成最佳化

ScienceAI發表於2025-02-26
圖片
編輯 | 2049

藥物研發週期長、成本高是製藥行業面臨的重大挑戰。據統計,一個新藥從研發到上市平均需要 12 年時間,投入高達 26 億美元。為提升研發效率,深度學習在分子生成領域取得了顯著進展。然而,大多數方法僅關注「設計什麼」,而忽視了「如何合成」這一關鍵問題。

來自東京科學大學(Institute of Science Tokyo)的研究團隊提出了一個名為 TRACER 的創新框架,透過將分子性質最佳化與合成路徑生成有機結合,實現了反應感知的化合物智慧探索。

該研究以「Molecular optimization using a conditional transformer for reaction-aware compound exploration with reinforcement learning」為題,於 2025 年 2 月 8 日發表在《Communications Chemistry》。
圖片

論文連結:https://www.nature.com/articles/s42004-025-01437-x

研究背景

當前分子生成模型面臨的核心矛盾在於「生成能力」與「合成可行性」的割裂。主流方法如 Molecule Chef 等基於潛空間最佳化的模型,雖能透過反應資料集學習化學轉化模式,但受限於單步反應處理和固定模板庫(約 100 個反應型別),難以應對真實合成中複雜的區域選擇性和化學選擇性)。

傳統 SA 評分等拓撲方法雖能快速評估合成難度,卻無法捕捉動態反應條件的影響。更深層的矛盾在於,現有模型要麼像 CasVAE 般依賴預定義模板庫導致創新性受限,要麼如 DoG-Gen 採用端到端架構犧牲了反應知識的顯式建模。這種技術斷層導致生成分子中僅 17-43% 具有實際合成價值。

TRACER 的創新突破在於將 1000 種真實反應型別編碼為條件令牌,使 Transformer 能同時學習「生成什麼」和「如何生成」,為藥物發現開闢反應感知的分子設計新維度。

圖片
圖示:先前研究和擬議方法的比較。(來源:論文)

理論框架:反應知識的三重編碼機制

TRACER 的核心理念建立在「反應條件-結構轉化-屬性最佳化」的協同學習上。不同於傳統潛空間模型將分子與反應資訊壓縮為連續向量,研究團隊採用顯式分離架構:圖卷積網路(GCN)預測適用反應模板,條件 Transformer 執行具體轉化,MCTS 負責全域性最佳化。

圖片

圖示:全面概述包含條件變壓器和 MCTS 的綜合模型。(來源:論文)

這種解耦設計使模型能同時處理兩類關鍵資訊流——GCN 從分子圖中提取的拓撲特徵與 Transformer 透過注意力機制捕捉的序列模式。

圖片

圖示:條件轉換器用於在反應模板條件下學習結構轉換的程式。(來源:論文)

特別值得關注的是條件令牌的引入,將反應型別索引嵌入 SMILES 序列頭部,使模型在訓練時能區分胺化、偶聯等不同轉化型別。如表 1 所示,加入反應條件使完美準確率從 0.2 躍升至 0.6,證明條件資訊能有效縮小化學空間搜尋範圍。

技術實現:虛擬合成樹的動態構建

在演算法層面,TRACER 透過四階段 MCTS 實現分子最佳化與路徑生成的閉環。

選擇階段採用改進 UCB 公式平衡探索-利用矛盾,其中價值函式 Q(s) 整合 QSAR 預測值和合成複雜度評估。擴充套件階段的雙重過濾機制是關鍵創新:GCN 首輪篩選出 10 個最相關反應模板(top-5 準確率 77.1%),隨後透過子結構匹配剔除 30% 不適用方案。

Transformer 在束寬 10-50 條件下生成候選產物,其獨特的多步推理能力可處理 Friedel-Crafts 醯化等複雜轉化。

圖片

圖示:對 DRD2 具有最高 QSAR 值的化合物及其合成路線。(來源:論文)

實驗顯示,相較於無約束 Transformer 僅 43.3% 的母核保留率,TRACER 達到 94.5%,證明其能有效維持藥物分子關鍵骨架。

實驗驗證:跨越三個靶點的效能突破

在 DRD2、AKT1、CXCR4 靶點的對比實驗中,TRACER 展現出獨特優勢。當束寬最佳化至 30 時,對 USPTO 庫外分子的生成比例達 99.8%,Fréchet ChemNet 距離 14.3,遠超 Molecule Chef(2.60)和 SynFlowNet(17.0)。

圖片

圖示:針對每種蛋白質的分子生成模型之間的比較。(來源:論文)

更值得注意的是,從 ZINC 資料庫篩選的初始分子(QSAR≈0)出發,經過 3-4 步虛擬合成即可獲得活性值 > 0.5 的化合物,其與已知配體的 Tanimoto 相似度最高達 0.838。

想在合成可行性方面,生成分子平均 SA 評分 2.52 與基準模型相當,但分子量分佈更接近上市藥物(412 vs 465 Da)。這些資料驗證了 TRACER 在探索性(生成新穎結構)與實用性(保證可合成性)之間的精妙平衡。

圖片

圖示:隨機森林中包含的超引數範圍和每個目標蛋白質的選定值。(來源:論文)

未來展望

TRACER 框架的突破性價值在於首次實現了分子屬性最佳化與合成路徑生成的耦合學習,將 AI 藥物發現從「紙上談兵」推向「實戰推演」。實驗證明其生成的化合物中大部分包含可商業化獲取的砌塊,這對加速 DMTA(設計-合成-測試-分析)迴圈具有現實意義。

當前模型仍受限於初始化合物選擇對最佳化效率的影響,且在涉及多組分反應的場景中預測精度有所下降。未來研究可透過引入反應條件推薦模組、整合逆合成分析,以及擴充套件至更大規模的反應型別訓練資料來增強實用性。

這項研究更深遠的意義在於揭示:當 AI 模型能夠理解化學轉化的內在邏輯時,虛擬分子設計才能真正對接實驗室的實際需求。

相關文章