編輯 | KX
生成式深度學習模型已用於分子從頭設計。化學語言模型(CLM)可用於自動設計具有所需屬性的分子。
在此,德國的研究人員探討了 CLM 在多藥理學設計中生成多靶標配體中的應用。
研究人員利用 CLM 從小分子微調集中學習的能力,併成功地將模型偏向於設計與靶標對的已知配體相似的類藥物分子。
經過合併微調後從 CLM 獲得的設計預測對兩種目標蛋白均有活性,並且在一個分子中包含兩種靶標的配體的藥效團元素。
對六個靶標對的十二種計算上有利的 CLM 設計的合成和測試表明,所有選定的設計都對至少一種靶標蛋白質具有高達兩位數納摩爾效力的調節作用,並確認七種化合物為設計的雙配體。這些結果證實了 CLM 多靶標從頭設計是藥物發現創新的源泉。
相關研究以《Automated design of multi-target ligands by generative deep learning》為題,發表在《Nature Communications》上。
論文連結:https://www.nature.com/articles/s41467-024-52060-8
AI 加速藥物研發
代謝綜合徵 (MetS) 和慢性炎症性等疾病都是由多種因素導致的,涉及多種訊號系統或代謝途徑的失調。雖然多因素疾病和多重病症的治療方案嚴重依賴於藥物組合(也稱為多藥治療),設計多藥理學,可以實現協同作用,改善治療結果,並克服多藥治療。
然而,設計針對幾種靶標蛋白質表現出強效活性的分子具有挑戰性。機器學習越來越多地用於加速藥物研發,也可能有助於設計多靶點藥物的發。
圖示:代謝綜合徵和 CLM 在多靶標從頭設計中的應用。(來源:論文)
化學語言模型(CLM)是經過訓練的深度學習模型,用於捕獲分子的字串表示(即 SMILES),可用於自動設計具有所需屬性的分子。CLM 已成功用於具有預期生物活性的新化學實體的從頭設計,並能夠在化學空間中導航以獲得量身定製的分子設計。
使用 CLM 的資料驅動從頭設計方法是「無規則的」,因為 CLM 能夠從訓練分子中提取相關特徵,例如生物活性。因此,CLM 還可以透過訪問兩種蛋白質配體共同的化學空間區域來完成多靶點設計的任務。
CLM 自動設計多靶點配體
在該研究中,研究人員系統地評估和最佳化了 CLM 的應用,來設計感興趣的蛋白質對的雙配體。
重點研究了在 MetS 相關疾病中具有已證實作用的六個靶標的組合:
(1) 血管緊張素 II 受體 1 型 (AT1),它在心血管系統中發揮關鍵訊號傳導作用;
(2) 法尼醇 X 受體 (FXR),一種重要的保肝轉錄因子和代謝調節劑;
(3) 遊離脂肪酸受體 1 (FFAR1、GPR40),參與胰島素和腸道激素分泌的控制;
(4) 過氧化物酶體增殖啟用受體 δ (PPARδ),它是多種組織中脂質和葡萄糖代謝的主要調節劑;
(5) 甲狀腺激素受體 β (THRβ),作為非酒精性脂肪肝疾病的靶標正在評估中;
(6) 可溶性環氧化物水解酶 (sEH),它與心血管和炎症疾病有關。
這些靶標涵蓋了廣泛的蛋白質家族,即 G 蛋白偶聯受體 (AT1、FFAR1)、核受體 (FXR、PPARδ、THRβ) 和酶 (sEH),這些蛋白質的配體具有治療相關性或已針對與 MetS 相關的疾病進行了臨床評估。值得注意的是,一些已批准的藥物選擇性地靶向其中一種蛋白質,經常在聯合治療中一起使用,這凸顯了設計雙配體在 MetS 中的潛力。
圖示:CLM 設計的雙配體的特徵。(來源:論文)
研究人員訓練 CLM 生成六個靶標對的雙配體,併合成了排名靠前的候選物進行前瞻性驗證。所有十二種 CLM 設計的化合物都在至少一個預期靶標表現出生物活性,併成功獲得了三個靶標對的七種雙重調節劑。
這些結果強調了 CLM 在訪問化學空間所需區域方面的價值,並證實了它們在多靶標配體的自動從頭設計中的應用。