編輯 | 蘿蔔皮
深度生成模型具有加速藥物設計的巨大潛力。然而,由於資料有限,現有的生成模型常常面臨泛化方面的挑戰,導致設計創新性較差。
為了解決這些問題,韓國 KAIST 的研究人員提出了一種相互作用感知的 3D 分子生成框架,該框架能夠在靶標結合口袋內進行相互作用引導的藥物設計。透過利用蛋白質-配體相互作用的通用模式作為先驗知識,該模型可以利用有限的實驗資料實現高度的通用性。
透過分析生成的未見靶標配體的結合姿勢穩定性、親和力、多樣性和新穎性等,對其效能進行了全面評估。此外,潛在突變選擇性抑制劑的有效設計證明了該方法對基於結構的藥物設計的適用性。
該研究以「3D molecular generative framework for interaction-guided drug design」為題,於 2024 年 3 月 27 日釋出在《Nature Communications》。
深度學習模型在資料匱乏的科學問題中,融合充分的先驗知識對發展可泛化的模型至關重要。例如,AlphaFold 透過利用共進化資訊和殘基對錶示,成功預測蛋白質結構。深度生成模型正在改變藥物設計正規化,但是其效能受限於藥物分子活性資料的缺乏,導致泛化能力低下。
最近的生成模型透過利用結合位的三維結構,無需依賴活性資料,進行基於結構的配體設計,提高了模型的泛化能力。一個泛化良好的模型應當理解蛋白-配體相互作用的普遍性質,包括氫鍵、鹽橋、疏水作用和 π-π 堆疊等。這對於形成穩定的結合構象和保持高度親和力至關重要。這些普遍存在的相互作用模式,是實現強效藥物設計的基礎。
基於這些情況,KAIST 的研究人員提出了一種相互作用感知的 3D 分子生成框架,該框架利用蛋白質-配體相互作用的普遍性質來指導基於結構的藥物設計。該框架由兩個主要階段組成:(1)相互作用感知條件設定和(2)相互作用感知 3D 分子生成。
圖示:框架概念說明。(來源:論文)
該框架的第一階段旨在透過研究給定結合位點 P 的蛋白質原子來設定相互作用條件 I。研究人員使用了四種型別的蛋白質-配體相互作用——氫鍵、鹽橋、疏水相互作用和 π-π 堆疊。這裡研究人員只考慮了蛋白質資料庫(PDB)中四種最主要的相互作用型別,主要因為他們使用了源自 PDB 的 PDBbind 2020 資料集進行模型訓練。
同時,該團隊開發了一種蛋白質原子相互作用感知調節策略。研究人員將相互作用條件定義為一組蛋白質原子的附加相互作用型別one-hot向量,它指示原子是否可以參與特定的相互作用以及它在相互作用中的作用。
蛋白質原子分為七類之一:陰離子、陽離子、氫鍵供體與受體、芳香族、疏水性和非相互作用原子。與將整個相互作用資訊表示為單個相互作用指紋相反,該團隊的策略旨在本地建立相互作用條件。
在這項工作中,研究人員主要透過兩種策略確定袋原子的相互作用類別。
在生成階段,由於受體與配體相互作用的資訊不總是可用,因此預定義了相互作用類別的標準,以便透過分析每個蛋白質原子來指定相互作用條件,這種條件設定被稱為無參考相互作用條件。
在訓練階段,利用蛋白質-配體複合物的地面真實結構來提取相互作用條件。
研究人員還提出了一種名為 DeepICL 的深度生成模型,用於逆向設計配體,該模型基於口袋的三維環境和第一階段的相互作用條件,逐步生成配體中的原子。
雖然靶標口袋可以根據結合配體及其結合姿勢,形成不同的蛋白質-配體相互作用型別組合;但該團隊的目標是使用名為 DeepICL 的 3D 條件生成模型逆向設計一種滿足特定相互作用組合的配體,該模型可應用於任何型別的蛋白質。研究人員配體應該結合的子口袋中使用區域性相互作用條件,而不是使用整個相互作用資訊,以防止對特定口袋或配體結構產生不良偏差。
圖示:相互作用感知條件配體闡述的示例。(來源:論文)
為了證明該框架進行基於結構的通用藥物設計的能力,而不是使用由 105 到 107 計算機生成的蛋白質-配體結合結構組成的典型基準,研究人員僅使用從 PDBbind 資料庫中精選的約 104 個真實晶體結構,因為即使是小規模資料,良好的泛化模型也可以成功提取適當的特徵。
圖示:生成框架的普遍性。(來源:論文)
研究人員透過分析生成的未見靶標配體的各方面性質來評估他們的模型——結合穩定性、親和力、幾何圖案、多樣性和新穎性。
a圖示:透過位點特異性相互作用調節選擇性控制配體設計。(來源:論文)
研究人員使用該模型來解決特定相互作用位點發揮關鍵作用的實際問題,證明他們的方法對基於結構的藥物設計的適用性。
論文連結:https://www.nature.com/articles/s41467-024-47011-2