編輯 | ScienceAI
本文作者為西湖大學 Haitao Lin,Yufei Huang, 深勢科技 Guojiang Zhao,Zhifeng Gao,及華盛頓大學 Odin Zhang 等;通訊作者為 Stan Z. Li. 被 ICLR2025 接受為 spotlight paper。
原文連結:https://openreview.net/forum?id=mOpNrrV2zH
程式碼連結:https://github.com/EDAPINENUT/CBGBench
簡要
基於結構的藥物設計(Structure-Based Drug Design, SBDD)旨在生成能夠與目標蛋白結合的潛在藥物分子,並在生成式 AI 技術的推動下得到了極大加速。然而,由於多樣化的實驗設定、複雜的實現、難以復現的結果以及單一任務的侷限性,這一領域仍缺乏系統性的理解。
首先,缺乏標準化會導致不同方法之間難以進行公平的比較,影響研究結論的可靠性。為了解決這一問題,我們提出 CBGBench,一個針對 SBDD 任務的綜合基準,它將 SBDD 統一為生成式圖補全(Generative Graph Completion)任務,類似於 3D 複合物結合圖的「完形填空」問題(fill-in-the-blank)。CBGBench 透過對現有方法進行屬性分類,構建了模組化、可擴充套件的框架,支援最新的生成方法,並確保公平的比較和評價。
其次,單一的 de novo 分子生成任務難以全面評估模型能力。為擴充 SBDD 的研究範疇,本文將生成模型適配到一系列核心任務,並將其視為圖填充任務的子任務,包括:
- 從頭分子生成
- 連線原子設計
- 分子片段補全
- 分子骨架生成
- 分子側鏈裝飾
所有任務均以蛋白結合位點口袋結構為條件,確保任務的生物學相關性。 在評估方面,本文采用公平且全面的評價體系,從多個維度評估生成模型的表現,包括:
- 蛋白-配體相互作用分析
- 化學合理性
- 幾何真實性
- 子結構有效性
此外,本文透過全面的實驗分析提供了對模型表現的深入見解,並揭示了現有 SBDD 方法的侷限性和改進空間。研究表明:
- 基於密度圖的卷積神經網路設計方法仍然十分有效,這也許是圖網路方法存在一定瓶頸。最佳化圖神經網路架構是一個重要的改進方向
- 基於 Diffusion 的方法在整體效能上超過其他生成式建模,是目前主流的研究方向。
- 自迴歸方法需在訓練時考慮到原子間鍵的幾何關係,因為鍵的幾何模式更容易被捕獲,從而生成化學上有效的分子;否則效果都不佳。
- 先驗知識仍然沒有很好地被融入模型,有效整合物理和化學領域知識,融入模型設計仍是挑戰,留有大量未來研究的空間。
- 大部分方法在先導化合物最佳化的任務上都可以直接應用,不過差距不明顯,關於相關任務還有很大的提升空間。
最後,為降低入門門檻並促進該領域的發展,我們提供了統一程式碼庫,涵蓋資料預處理、模型訓練、取樣和評估,以支援研究人員和工程師更高效地開發和測試 SBDD 相關模型。
CBGBench 旨在建立一個標準化、可擴充套件的基準,促進結構基藥物設計中更系統、公平和可復現的研究,為未來的 SBDD 研究奠定堅實基礎。
引言
結構基藥物設計(SBDD)廣泛應用於新藥發現,其目標是生成能夠與目標蛋白結合的化學分子。近年來,生成式 AI 在 SBDD 任務中的應用日益增多,特別是基於深度學習的分子生成模型,得益於 Graph Neural Networks(GNNs)和 Diffusion Models 的發展,極大提升了分子設計的效率。然而,SBDD 領域仍存在如下挑戰:
- 研究方法不統一:不同研究採用不同的任務定義和實驗設定,導致難以進行公平的比較。
- 實驗實現複雜且復現困難:許多方法程式碼封閉或依賴特定環境,缺乏標準化的評測體系。
- 任務設定單一:大多數研究僅關注 de novo 分子生成,而忽略了其他關鍵的藥物設計任務,如 Linker 設計、片段補全、骨架生成等。
為解決這些問題,我們提出 CBGBench,它提供:
- 統一任務定義:將 SBDD 歸納為生成式圖補全(Graph Completion)問題,使不同方法可以在相同框架下進行比較。
- 模組化與可擴充套件性:支援多種 SBDD 任務,涵蓋分子生成、Linker 設計、片段補全等關鍵任務。
- 系統性評估體系:採用多維度評估指標,確保模型在相互作用、化學性質、幾何真實性和子結構有效性方面的表現。
CBGBench 評估模型以及任務定義
我們首先將現有的方法進行分類,根據以下三個標準對這些方法進行分類:
- 原子位置是否在連續的三維空間中生成,還是在體素化網格中生成。
- 生成過程是自迴歸的(auto-regressive)還是一次性生成的(one-shot)。
- 是否引入了領域知識,將額外的先驗資訊整合到模型中。
圖示:評估的方法以及分類
此外,我們將 SBDD 任務建模為 3D 複合物結合圖的「填空」任務(fill-in-the-blank),即在給定蛋白結合位點(Pocket)結構的情況下,生成符合特定條件的化合物。具體而言,我們定義了以下五個關鍵任務:
圖示:任務的型別以及相關預處理後的資料
1. De novo 分子生成 (De novo Generation)
- 輸入:蛋白結合口袋
- 目標:生成完整的新分子,與蛋白結合位點形成穩定的相互作用。
2. 連線體設計 (Linker Design)
- 輸入:蛋白結合口袋 + 片段 A 和片段 B
- 目標:生成化學連線體(Linker),使兩個片段在 3D 結構上連線,同時維持生物活性。
3. 片段生長(Fragment Growing)
- 輸入:蛋白結合口袋 + 部分分子片段
- 目標:預測並補全缺失的分子部分。
4. 骨架生成(Scaffold Hopping)
- 輸入:蛋白結合口袋 + 側鏈
- 目標:生成新的骨架(Scaffold),在保持配體關鍵特徵的同時最佳化結合能力。
5. 側鏈裝飾(Sidechain Decoration)
- 輸入:蛋白結合口袋 + 骨架
- 目標:最佳化分子的側鏈,使其與蛋白結合更緊密,同時滿足藥物開發要求。
評估體系
我們提出了一套全面的評估體系,涵蓋四大核心維度:
1. 蛋白-配體相互作用質量
- 基於結合能(Binding Affinity)的評估
- 統計氫鍵、疏水作用等關鍵相互作用
2. 化學性質
- 計算分子可合成性(Synthetic Accessibility)
- 評估分子藥物相似性(Drug-likeness)
- 計算 LogP、Lipinski 規則等指標
3. 幾何真實性
- 評估 3D 結構合理性(如鍵長、鍵角等)
- 分子-蛋白複合體構象的穩定性(是否存在clash等)
4. 子結構有效性
- 驗證生成的分子是否包含關鍵藥效團
結果分析
圖示:最終的綜合結果得分以及方法排名
我們的實驗表明:
1. 基於 CNN 的方法(如 LIGAN 和 VOXBIND)具有高度競爭力,特別是在相互作用方面,這也解釋了為什麼這些方法在藥物設計和分子生成領域近年來依然佔據主導地位。這在一定程度上歸因於 CNN 在利用單個濾波器感知多體模式方面相比 GNN 更具優勢。因此,這也激勵了進一步研究 GNN 在 3D 點雲中的應用,開發能夠與 CNN 相媲美的架構。
2. 在基於 GNN 的方法中,MOLCRAFT 實現了最佳的整體效能,而 TARGETDIFF 緊隨其後。與之相比,作為 TARGETDIFF 的變種,整合了領域知識的 DECOMPDIFF 和 D3FG 的效能有所下降。這表明當前引入的物理化學先驗知識很難提升生成分子的質量。有效地將領域知識整合到模型中以引導生成結構合理的分子仍然是一個挑戰。例如,生成的分子中原子衝突(atom clashes)是常見的問題。儘管 DECOMPDIFF 採用了先驗指導來解決這一問題,但仍未完全解決。將領域知識整合到訓練過程中可能有助於緩解這一問題。
3. 只有 POCKET2MOL 作為自迴歸方法取得了具有競爭力的結果,我們歸因於以下原因:首先,它利用化學鍵約束原子沿化學鍵有序生長,而不是像 DIFFBP 那樣基於與口袋的距離進行生長。其次,它同時預測鍵型別,並透過對比學習,取樣原子位置的正負例項,將真實和虛假的鍵作為正負樣本,這一點 FLAG 沒有充分考慮,從而增強了模型感知化學鍵模式的能力。因此,我們認為使自迴歸方法能夠成功捕捉化學鍵的模式是至關重要的。
4. 骨架生成在子任務中(Scaffold Hopping)是最具挑戰性的任務,因為生成分子相對於參考分子的改進非常有限;而連線體設計(Linker Design)相對來說是最容易的任務。
5. 直接應用這些方法在最佳化任務中,雖然效果理想,但是仍有很大的改進空間,這是由於在大多數情況下,生成的分子並沒有被最佳化(binding affinity 相關指標沒有提升)。一些前沿技術,如 DPO 和 ITA ,可以用來增強最佳化後的分子在模型中的監督佔比。
程式碼開源與未來展望
為降低入門門檻,我們提供統一程式碼庫,包括:預處理資料集;訓練和評估指令碼;SBDD 相關的生成模型。
未來,我們計劃進一步擴充套件任務型別、整合更多基於 AI 的 SBDD 方法、提供更高效的計算最佳化策略。
我們希望 CBGBench 能夠成為 SBDD 研究領域的標準基準,推動AI輔助的基於結構藥物設計的發展。