編輯 | 蘿蔔皮
在不斷髮展的藥物發現領域,傳統方法由於效率低和資源需求高而面臨重大挑戰。
AI 藥物公司 Model Medicines 和加州大學聖地亞哥分校的研究人員開發了 GALILEO AI 藥物發現平臺及其核心模型 ChemPrint,旨在提高藥物發現的效率。
為了解決命中率低和探索新化學空間困難的挑戰,該平臺採用自適應分子嵌入和嚴格的模型訓練環境來增強預測能力並導航未知的分子領域。
在針對 AXL 和 BRD4 腫瘤學靶標的案例中,ChemPrint 實現了 45.5% 的體外命中率,並鑑定了 20 種新型作用化合物。這些化合物表現出巨大的化學新穎性,其訓練集的平均 Tanimoto 相似度得分為 0.32。
該研究以「ChemPrint: An AI-Driven Framework for Enhanced Drug Discovery」為題,於 2024 年 3 月 27 日釋出在 bioRxiv 預印平臺。
傳統藥物發現方法面臨資源消耗大、效率低下等嚴峻挑戰,尤其是在高通量篩選(HTS)後階段成功率極低,導致大量潛在藥物候選化合物未能轉化為臨床藥物。
此外,現有AI模型在預測未知化學空間的化合物性質時能力有限,易受訓練資料集化學多樣性的制約。
因此,亟需發展能夠有效探索新化學領域並準確預測新型活性化合物的AI驅動藥物發現框架,以突破傳統瓶頸,顯著提高藥物發現的成功率。
為了應對這些挑戰,Model Medicines 和加州大學聖地亞哥分校的研究人員,提出了人工智慧藥物發現平臺 GALILEO 及其核心元件零樣本分子幾何深度學習 (Molecular-Geometric Deep Learning,Mol-GDL) 模型 ChemPrint。
圖示:GALILEO AI 藥物發現平臺工作流程。(來源:論文)
GALILEO AI 藥物發現平臺是一個綜合性的智慧系統,旨在透過先進的人工智慧技術革新傳統藥物發現流程,大幅提高新藥候選物的篩選效率與成功率。
平臺透過整合大規模的高通量篩選(HTS)資料,利用自適應分子嵌入和嚴格的模型訓練環境,增強對未知化學空間的探索能力。GALILEO 平臺透過創新的資料分割技術,如 t-SNE 方法,來最大化訓練集和測試集之間的差異性,從而更好地預測和發現新化合物。
ChemPrint 模型作為 GALILEO 平臺的核心元件,是一種基於 Mol-GDL 的創新 AI 模型。該模型透過學習分子的幾何結構與化學特性,生成適應性強、能夠保留關鍵化學資訊的分子嵌入表示。
ChemPrint在訓練與驗證過程中注重實際藥物發現場景的應用而非僅追求技術指標,展現出卓越的預測能力,能在未探索的化學空間中精準識別具有新穎活性的化合物。
圖示:ChemPrint 訓練週期期間 AXL t-SNE 分割資料的模型潛在嵌入的 t-SNE 視覺化。(來源:論文)
其在針對 AXL 和 BRD4 腫瘤學靶點的案例中取得了高達 45.5% 的體外命中率,比業界公佈的平均命中率提高 75%;同時,鑑定了 20 種新型作用化合物。這些化合物表現出巨大的化學新穎性,其訓練集的平均 Tanimoto 相似度得分為 0.32,與已知化合物顯著不同,顯著超越傳統方法。
研究人員採用最佳化技術來減少過度擬合,從而建立高度專業化的自適應分子嵌入,證實其在前瞻性藥物發現研究中的有效性。這一進步對於實現臨床的發現至關重要。
總而言之,GALILEO 和 ChemPrint 有效地彌合了學界期望的人工智慧效率與實際治療、藥物發現之間的差距。該團隊所展示的平臺解決了人工智慧驅動的藥物發現中一些最困難的挑戰,為追求更高效、更有效的藥物開發流程提供了一條充滿希望的道路,最終將為拯救生命發揮力量。
論文連結:https://www.biorxiv.org/content/10.1101/2024.03.22.586314v1