為233種疾病推薦候選藥物,中國科學院深度生成模型助力藥物發現,登Nature子刊

ScienceAI發表於2024-11-01

圖片

編輯 | 蘿蔔皮

瞭解轉錄對化學擾動的反應是藥物發現的核心,但對疾病化合物組合進行詳盡的實驗篩選是不可行的。

為了克服這一限制,中國科學院、四川大學華西醫院的研究人員提出了 PRnet,這是一種擾動條件下的深度生成模型,可預測轉錄對從未在體細胞和單細胞水平上進行實驗擾動的新化學擾動的反應。

評估表明,PRnet 在預測新化合物、新途徑和新細胞系的反應方面優於已有方法。PRnet 能夠基於基因特徵對基因水平的反應進行解釋,並針對疾病進行計算機藥物篩選。

PRnet 進一步識別並透過實驗驗證了針對小細胞肺癌和結直腸癌的新型化合物候選物。並且,PRnet 生成了大規模的擾動譜整合圖譜,涵蓋了 88 種細胞系、52 種組織和各種化合物庫。

PRnet 提供了強大且可擴充套件的候選藥物推薦工作流程,併成功推薦了 233 種疾病的候選藥物。總體而言,PRnet 是一種有效且有價值的基因治療篩選工具。

該研究以「Predicting transcriptional responses to novel chemical perturbations using deep generative model for drug discovery」為題,於 2024 年 10 月 26 日釋出在《Nature Communications》。

圖片

對化學擾動的轉錄反應揭示了生物功能的基本見解,並在疾病理解和藥物發現中發揮著不可或缺的作用。批次和單細胞 RNA 測序 (scRNA-seq) 實驗促進了在組學水平上對化學擾動進行高通量篩選(HTS)。

近期的 HTS 研究已對數千種將細胞或細胞系暴露於化合物的獨立擾動進行了實驗分析。這些對化學擾動的轉錄反應揭示了代表個體和細胞過程的連貫可解釋的基因級程式,並根據化學擾動對其進行了量化。

儘管取得了令人鼓舞的進展,但實驗篩選化學擾動仍然是一個耗時且昂貴的過程,新療法的發現率很低。透過實驗篩選疾病和化合物組合來徹底探索廣闊的新型化學擾動空間是難以實現的。

為了解決現有實驗方法有限的探索能力,中國科學院、四川大學華西醫院的研究團隊開發了 PRnet,這是一個靈活且可擴充套件的擾動條件深度生成模型,它支援預測對從未在批次和單細胞水平上進行實驗研究過的新型化學擾動的轉錄反應。

PRnet 是一種基於編碼器-解碼器架構的新型生成模型,由三個元件組成,包括擾動介面卡、擾動編碼器和擾動解碼器。PRnet 透過將化合物結構和未受干擾的轉錄譜作為輸入來預測轉錄反應,從而適應各種擾動場景中的新型化合物和疾病。

圖片

圖示:方法概述。(來源:論文)

Perturb-adapter 使用簡化的分子輸入線路輸入系統 (SMILES) 化學編碼作為輸入,從而能夠推廣到無需先驗知識和註釋的未見過的化合物。

PRnet 的可學習潛在空間有助於解釋基因水平的反應並捕捉異質性。PRnet 經過了近一億個批次 HTS 觀測(受 175,549 種化合物干擾)和數千萬個單細胞 HTS 觀測(受 188 種化合物干擾)的訓練。

至關重要的是,該模型以資料驅動的模型執行,可以有效地推廣到新的擾動。

圖片

圖示:PRnet 在預測基因表達的擾動後變化方面優於其他方法。(來源:論文)

評估表明,PRnet 在預測大量和單細胞 HTS 資料中對新化合物、途徑和細胞系的轉錄反應的變化和表達方面優於其他方法。

為了進一步驗證其有效性,該團隊利用 PRnet 識別了針對小細胞肺癌(SCLC)的新型生物活性化合物,並尋找針對結直腸癌(CRC)的新型天然化合物。實驗驗證表明,新型候選化合物在適當的預測濃度範圍內對 SCLC 和 CRC 細胞系具有活性。

圖片

圖示:PRnet 確定的針對小細胞肺癌和結直腸癌的候選藥物。(來源:論文)

該模型的靈活性和可擴充套件性使其成為篩選各種疾病候選藥物的寶貴工具。因此,研究人員利用 PRnet 在計算機上篩選各種化合物庫,並生成了一個虛擬的大型擾動圖譜整合圖集,涵蓋 88 種細胞系和 52 種組織,以及包含 935 種 FDA 批准藥物、4158 種活性化合物、30,456 種天然化合物和 29,670 種類藥物化合物的化合物庫。

圖片

圖示:PRnet 在大型擾動輪廓整合圖譜上提供了強大且可擴充套件的推薦工作流程。(來源:論文)

PRnet 還根據基因集的參考變化,為疾病提供了穩健且可擴充套件的候選推薦工作流程。給定疾病特異性或敏感的化合物基因特徵,採用基因集富集分析 (GSEA) 來評估化合物對這些疾病的潛在功效。

PRnet 根據概況圖譜成功推薦了 577 項研究中的 577 種候選藥物清單,用於 233 種不同的疾病。

在三種代謝紊亂病例中,包括非酒精性脂肪性肝炎 (NASH)、多囊卵巢綜合徵 (PCOS) 患者和炎症性腸病 (IBD),PRnet 推薦的藥物得到了先前的人體或動物研究文獻的支援。

PRnet 能夠有效預測對新的複雜化學擾動的轉錄反應並篩選針對特定疾病的大規模化合物庫,因此成為基於基因的治療篩選的有價值的工具。

論文連結:https://www.nature.com/articles/s41467-024-53457-1

相關文章