準確預測藥物-靶點相互作用,江南大學提出深度學習融合GNN新方法MINDG

ScienceAI發表於2024-05-24
圖片

編輯 | 紫羅

藥物-靶點相互作用(DTI)預測在藥物發現中發揮著重要作用。儘管藥物靶點預測的智慧計算方法受到了廣泛關注,並取得了許多進展,但仍然是一項具有挑戰性的任務,需要進一步的研究。

為了解決上述挑戰,江南大學研究團隊提出了一種整合深度學習和圖學習的多檢視整合學習網路(MINDG)。

MINDG 結合圖學習和深度學習來提取藥物和蛋白質的內在結構資訊,以及它們之間的外在關係資訊。因此,與之前的方法相比,MINDG 提高了模型預測的效能。

相關研究以《MINDG: a drug–target interaction prediction method based on an integrated learning algorithm》為題,於 2024 年 3 月 14 日釋出在《Bioinformatics》上。

圖片

GitHub 地址:https://github.com/jnuaipr/MINDG
論文連結:https://doi.org/10.1093/bioinformatics/btae147

四種 DTI 預測方法

DTI 預測指預測給定的藥物分子是否會與特定靶點結合,從而發揮靶向治療作用。

目前 DTI 預測方法主要有四類:基於相似性的方法、機器學習方法、深度學習方法和圖學習方法。

基於相似性的方法,例如,阿卜杜拉國王科技大學 (KAUST) Thafar 團隊提出的 DTi2Vec 方法可以預測藥物和蛋白質之間的聯絡,而無需挖掘藥物和蛋白質的額外內部資訊。

機器學習方法利用蛋白質結構和序列資訊來預測目標。例如,使用化學結構、藥物質譜和氨基酸序列來表示蛋白質以預測藥物-靶標相互作用。

深度學習方法將特徵、模型和生物資訊學網路與其他方法相結合,以獲得更好的預測結果。

目前,在 DTI 預測的可用方法中,基於圖卷積網路(GCN)的方法最有前景。

藥物靶標預測的智慧計算方法受到了廣泛關注並取得了重大進展。然而,這仍然是一項具有挑戰性的任務。

主要挑戰表現為:(i)大多數基於圖神經網路(GNN)的方法只考慮圖中一階相鄰節點(藥物和靶標)的資訊,而沒有從高階相鄰節點中學習更深入、更豐富的結構特徵。(ii)現有方法沒有同時考慮藥物和靶標的序列和結構特徵,各方法相互獨立,無法結合序列和結構特徵的優點來提高互動式學習效果。

MINDG 提高了 DIT 預測效能

為了應對這一挑戰,該研究提出了一種整合深度學習和圖學習的多檢視整合學習網路(MINDG)。

圖片

圖示:MINDG 模型的總體架構。(來源:論文)

該網路由以下部分組成:(i)採用混合深度網路(HDN)提取藥物和靶點的序列特徵,(ii)提出了高階圖注意卷積網路以更好地提取和捕獲結構特徵,(iii)使用多檢視自適應整合決策模組對上述兩種網路的初始預測結果進行改進和補充,提高預測效能。

圖片

圖示:混合深度網路(HDN)的結構圖。(來源:論文)

該研究的貢獻主要體現在三個方面:

  • 設計藥物和蛋白質靶標圖學習的注意力機制,並提出高階圖注意力卷積網路(HOAGCN)。

  • 融合訊息傳遞神經網路 (MPNN) 和卷積神經網路(CNN)方法來增強藥物和蛋白質目標序列的結構特徵學習;。

  • 提出整合深度學習和圖學習的多檢視整合學習網路(MINDG)。

圖片

圖示:高階圖注意力卷積網路(HOAGCN)的結構。(來源:論文)

實驗研究

為了驗證 MINDG 的有效性,在以下方面進行了實驗分析:(i)與當前效能較好的藥物-靶點相互作用預測方法的效能比較;(ii) 進行了消融實驗;(iii) 進行了預測結果的應用研究。

在兩個資料集上(BindingDB 和 DAVIS)評估 MINDG,表明與最先進的基線相比,它提高了 DTI 預測效能。MINDG 結合了圖神經網路深度學習方法的優點,比單獨使用任何一種方法都有更好的效能。

圖片

圖片

接下來,進行了消融分析,研究了多檢視學習對預測效能的影響。

圖片

從實驗結果中可以看出,與 View1、View2 和 MAIDM 相比,MINDG 改進了所有資料集的指標。無論使用哪種單獨檢視,相應模型的預測能力都弱於基於兩種檢視協同的預測效能。這也表明多個檢視具有互補作用,透過它們的協同作用,可以更充分地利用高階圖注意力網路和混合深度網路學習到的不同檢視的深層特徵,從而提高整體模型的效能。

最後,利用 MINDG 進行抗病毒藥物再利用的探索。使用由清華大學 Gao Yan 等人解析的 SARS-CoV-2 3CL 蛋白酶序列輸入模型,預測結合親和力值排名前 10 的藥物。

圖片

在 MINDG 生成的候選藥列表中藥物療效的實際應用,有助於證明 MINDG 預測結果的資訊價值。

不足和改進方向

MINDG 與一些最先進的方法進行了各種比較,結果表明所提出的方法效能更佳。

然而,MINDG 只是以順序的方式學習藥物和蛋白質的內在結構資訊,並沒有充分利用所有可用的內在結構資訊。

未來,圖學習方法可能會被用來學習藥物和蛋白質的內在結構。此外,由於研究有限,研究人員還沒有進行溼實驗階段。計劃將來進行進一步的溼實驗,包括藥物 panel 測試。

【推薦閱讀】

  • 藥物分子設計新策略,微軟條件擴散模型DiffLinker登Nature子刊
  • 可發現藥物靶點,哈佛、Hopkins、中國科學院等機構基於Transformer開發了一種可對蛋白翻譯動態變化建模的深度學習方法
  • 100%化學有效,高度類似藥物,川大開發資料和知識雙驅動的AI分子生成框架
  • 進行藥物靶標親和力預測,浙大&華科大團隊開發擴充套件圖學習卷積網路方法
  • 藥物-靶標親和力預測,上科大團隊開發了一種Transformer編碼器和指紋圖譜相結合的方法
  • 中科大團隊提出 SDGAE,一種基於圖卷積自編碼器的 DTI 預測方法

相關文章