基於藥效團與GPT從頭生成分子,北大開發TransPharmer助力藥物發現

ScienceAI發表於2025-03-11

圖片

編輯 | 蘿蔔皮

深度生成模型推動了藥物發現,但生成的化合物通常結構新穎性有限,限制了藥物化學家的靈感。

為了解決這個問題,北京大學的研究人員開發了 TransPharmer,這是一種生成模型,它將基於配體的可解釋藥效團指紋與基於生成預訓練 Transformer(GPT)的框架相結合,用於從頭生成分子。

TransPharmer 在無條件分佈學習、從頭生成和藥效團約束下的骨架構建方面表現出色。其獨特的探索模式可以增強骨架跳躍,生成結構不同但藥理學相關的化合物。這為發現結構新穎且具有生物活性的配體提供了一種有前途的工具。

該研究以「Accelerating discovery of bioactive ligands with pharmacophore-informed generative models」為題,於 2025 年 3 月 10 日釋出在《Nature Communications》。

圖片

識別具有針對目標生物活性的化合物一直是合理藥物發現的重要目標之一。基於深度學習的生成模型已成為當前的主要方法,證明了其在實現這一目標方面的有效性。許多研究人員還專注於透過研究模型元件的多種組合(包括架構、分子表示和最佳化演算法)來探索分子生成模型的潛力。

生成模型雖有效,但其創造力與人類相比如何,能否啟發人類專家仍然存疑。實驗表明,深度學習模型難以提出符合人類藥物化學家認可的分子設計,且自動生成的生物活性化合物的新穎性頗受爭議。

科學家透過微調化學語言模型,可以生成與已知化合物高度相似的抑制劑結構。這說明生成模型需深入理解「正確配方」才能生成既具生物活性又新穎的化合物。

藥效團模型為增進這一理解提供了替代方法,這類模型透過提取藥物作用的關鍵特徵構建分子表徵框架,既可促進不同化學骨架配體間的結構躍遷,又能建立分子構效關係的可解釋連線。

近期,整合泛藥效團特徵的生成系統已能設計出保留關鍵藥效特徵的新型分子結構,部分模型甚至實現了對現有藥物骨架的定向改造,不過大多數基於藥效團生成的新分子尚未透過實驗驗證。

TransPharmer

在最新的研究中,北京大學的研究人員提出了一種創新的藥效團感知生成模型 TransPharmer,該模型採用基於配體的藥效團核來實現結構抽象,同時保留細粒度的拓撲資訊。基於配體的藥效團核與之前研究中使用的基於配體的虛擬篩選核類似。

圖片

圖示:TransPharmer 架構示意圖。(來源:論文)

這裡的藥效團核心被編碼為多尺度且可解釋的指紋,作為 TransPharmer 的提示。TransPharmer 的架構讓人聯想到生成式預訓練 Transformer(GPT),它在藥效團和簡化分子輸入線輸入系統(SMILES)所代表的分子結構之間建立了聯絡。

圖片

圖示:圍繞 Onvansertib 的化學空間探索。(來源:論文)

研究人員認為,為 GPT 配備藥效團知識可使該模型專注於化學結構的藥理方面並生成類藥分子。在他們的評估中,TransPharmer 在涉及藥效團約束下的從頭生成和支架闡述的任務中表現出優於其他基線模型的效能。

該團隊還強調了 TransPharmer 在探索參考化合物周圍區域性化學景觀方面的獨特模式,使其非常適合藥物發現中的骨架跳躍任務。

圖片

圖示:DRD2 的回顧性實驗。(來源:論文)

他們透過涉及 DRD2 和 PLK1 的兩個案例研究進一步驗證了 TransPharmer 產生創新和生物活性配體的能力。研究人員透過實驗測試了四種針對 PLK1 的生成化合物,這些化合物具有一系列新骨架。

圖片

圖示:使用 TransPharmer 和化合物優先順序生成針對 PLK1 的虛擬化合物庫。(來源:論文)

其中,四種化合物中有三種在 1 μM 以下表現出抑制活性,其中最有效的化合物 IIP0943 表現出 5.1 nM 的活性(參考 PLK1 抑制劑為 4.8 nM)。此外,與其他 Plks 相比,IIP0943 對 PLK1 表現出較高的選擇性,並且在針對 HCT116 細胞系的細胞增殖中表現出亞微摩爾活性。

圖片

圖示:所設計化合物的合成路線及酶抑制活性。(來源:論文)

因此,TransPharmer 代表了一種基於藥效團的生成模型,該模型可成功執行骨架跳躍,從而產生具有強效生物活性的獨特化合物。IIP0943 的 4-(苯並[b]噻吩-7-基氧)嘧啶骨架可以為設計改進新型 PLK1 抑制劑提供幫助。

圖片

圖示:生成的化合物 IIP0943 的細胞抑制活性和對接姿勢。(來源:論文)

結語

TransPharmer 中使用的藥效團指紋是寶貴的提示,使模型能夠在設計不同靶標的配體之間無縫轉換,而無需進行額外的微調。DRD2 和 PLK1 的案例研究證明了這一能力,表明 TransPharmer 可輕鬆應用於各種場景。

與其他基於 GPT 類架構的分子生成模型相比,TransPharmer 透過藥效團指紋提示,將先前的知識融入到藥物相關化合物的生成中,從而更貼近藥物化學家的目標。

這種方法還為開發廣泛的藥物生成模型鋪平了道路,這些模型將多模態知識與從分子結構中得出的基本化學原理相結合。

此外,TransPharmer 利用藥效團的結構跳躍特性,可以用於發現針對相同藥物靶標具有生物活性的新型化合物。

雖然如此,未來仍可探索幾個方向來增強該模型的多功能性和普遍適用性。

第一,應將片段連結等其他生成模式與從頭生成和支架構建結合起來。無序化學語言建模的進步可以直接支援這些功能。

第二,生成易於合成的分子的生成模型更可取,因為它們可以加快溼實驗室實驗驗證的時間。

第三,應將多目標最佳化整合到生成過程中,以支援更高效的設計。

論文連結:https://www.nature.com/articles/s41467-025-56349-0

相關文章