像拼樂高一樣設計新藥,EPFL、牛津團隊AI方法精確設計最佳化分子3D結構

ScienceAI發表於2024-12-27

圖片

編輯 | 2049

想象一下,如果開發一款新藥就像積木搭建一樣,可以自由組合不同的分子部件,並準確預測它們與目標蛋白質的結合效果。這聽起來可能很科幻,但最新發表的研究讓這一願景更近了一步。

瑞士聯邦理工學院(EPFL)、劍橋大學、康奈爾大學、牛津大學的聯合研究團隊開發的AI系統 DiffSBDD ,就像是一位經驗豐富的分子建築師,能夠精確設計和最佳化藥物分子的 3D 結構。

該研究以「Structure-based drug design with equivariant diffusion models」為題,於 2024 年 12 月 9 日釋出在《Nature Computational Science》。

圖片

新藥研發是一個極其耗時和昂貴的過程。傳統方法通常需要科學家從數百萬個候選分子中篩選,就像在大海中尋找針一樣。即使找到了有潛力的分子,還需要經過漫長的最佳化過程。更重要的是,現有的 AI 輔助方法往往過於專一,缺乏靈活性。因此,能否找到一種更靈活、更高效的方法,正成為業界和學術界共同關注的焦點。

技術創新:SE(3)- 等變擴散模型的工作原理

DiffSBDD 的核心創新在於將 SE(3)- 等變擴散模型引入結構導向的藥物設計中。該方法將藥物設計轉化為一個三維條件生成問題,透過引入 SE(3)- 等變性來處理分子系統中的自然對稱性,包括旋轉和平移,但特意排除了不可疊加的轉換。

這種設計選擇源於廣泛研究的藥物立體化學案例。如抗抑鬱藥 citalopram(圖1e)具有兩種對映異構體,但只有S型具有所需的治療效果。這種異構體間的差異只能透過反射敏感的模型來檢測,證明了 SE(3)- 等變性在手性藥物設計中的重要性。從這一原理可見,分子立體結構的細微差異對藥效影響巨大,正是 DiffSBDD 發力之處。

圖片

圖 1:方法概述。(來源:論文)

DiffSBDD的工作流程可分為兩個主要階段:

訓練階段

在訓練過程中,擴散過程 q 對原始原子點雲進行噪聲處理,生成不同時間步長的噪聲版本。神經網路模型學習近似這個逆過程,以目標蛋白質結構作為條件。一旦訓練完成,初始噪聲點雲從高斯分佈中取樣,並使用學習的轉移機率逐步去噪。最後在生成過程末尾新增共價鍵。完成上述訓練後,系統便能為後續的條件生成打下堅實基礎,讓分子去噪過程更加精準。

條件生成階段

針對蛋白質口袋的 3D 生成模型,研究團隊提出了兩種不同方法:

1、DiffSBDD-cond: 在去噪過程中保持蛋白質口袋環境不變。

2、DiffSBDD-joint: 先學習配體-口袋對的聯合分佈,推理時再引入目標口袋資訊。

兩種方法在CrossDocked和Binding MOAD測試集上均表現優異,生成的分子具有與參考分子相當或更好的結合得分。以人類受體(PDB:6c0b)為例,模型能夠將原本類藥性較差(QED=0.36)的長鏈脂肪酸最佳化為具有更好藥物特性(QED=0.87)的分子,透過合理設計芳香環和可旋轉鍵實現了更優的結合構象和熵貢獻。

圖片

圖 2:評估分散式學習能力和生成的例項。(來源:論文)

DiffSBDD 的多功能分子設計能力

DiffSBDD 展現出在藥物研發中的通用性和靈活性,無需為每個具體任務重新訓練模型就能勝任多項關鍵任務。正是在這些多樣化場景中的成功應用,印證了它作為“通用分子設計平臺”的潛力。

分子結構設計能力

在分子片段任務中,DiffSBDD 展示了多樣的設計能力。模型能以給定片段為基礎構建完整藥物分子,同時可以保留關鍵功能團並重新設計分子骨架。一個典型案例是激酶抑制劑(PDB 編號 2gm1)的重設計,模型在保持結合活性的同時成功重構了分子骨架。在片段合併方面,研究團隊展示了將 SARS-CoV-2 Nsp3 蛋白的兩個片段(PDB 編號 5rsw 和 5rue)成功整合的實驗。

圖片

圖 3:分子著色結果。(來源:論文)

選擇性最佳化與多屬性調控

在激酶抑制劑最佳化的案例中,DiffSBDD 展示了其多目標最佳化能力。模型透過五輪最佳化,將分子對目標激酶 BIKE(PDB 編號 4w9w)的結合得分從 -7.2 提升至 -13.9,同時降低了對非目標激酶 MPSK1(PDB 編號 2buj)的結合傾向,從 -10.8 降低至 -8.7。除了選擇性最佳化外,模型還能同時調控多個藥物屬性,包括類藥性(QED,從 0.35 提升至 0.54)、合成可行性(SA score)、結合親和力(Vina score)等關鍵物理化學性質。

這種多功能性源於模型的兩個關鍵創新:首先是其通用性,一個預訓練模型即可應用於廣泛的問題範圍;其次是設計約束的靈活性,能夠同時處理現成屬性最佳化、顯式負向設計和部分分子設計等多種任務。如原文所述「While we provide empirical results for only our model, the methodology can be readily used in combination with other recently published diffusion models for small-molecule design」這種方法學的普適性為藥物研發提供了新的可能性。

圖片

圖 4:使用 DiffSBDD 進行分子最佳化的結果。(來源:論文)

侷限性與未來展望

儘管 DiffSBDD 展現出強大的藥物設計潛力,研究團隊也坦言仍面臨挑戰:純從頭設計(de novo design)難度較大,常因樣品質量和可合成性受限而阻礙實驗驗證。研究表明,在真實亞結構(如片段或支架)範圍內進行設計往往成效更佳,並可藉助保留先前合成分子的關鍵片段來簡化化學合成和測試。

與以往針對特定任務訓練的專用模型不同,DiffSBDD 透過修改取樣過程即可勝任多項子任務,只需持續最佳化主模型的分佈學習和樣本質量便能整體提升效能。隨著這項技術不斷成熟,我們或許正邁向更智慧化、個性化的藥物研發時代,藉由其靈活探索分子空間的能力,為精準醫療開啟新的大門。

論文連結:https://www.nature.com/articles/s43588-024-00737-x

相關文章