30倍於傳統方法,中國科學院團隊Transformer深度學習模型預測糖-蛋白質作用位點

机器之心發表於2024-07-01

圖片

糖類是自然界中最豐富的有機物質,對生命至關重要。瞭解糖類如何在生理和病理過程中調節蛋白質,可以為解決關鍵的生物學問題和開發新的治療方法提供機遇。

然而,糖類分子的多樣性和複雜性,對實驗識別糖-蛋白質結合以及相互作用的位點提出了挑戰。

在這裡,中國科學院團隊開發了一種深度學習模型 DeepGlycanSite,它能夠準確預測給定蛋白質結構上的糖結合位點。

DeepGlycanSite 將蛋白質的幾何和進化特徵融入具有 Transformer 架構的深度等變圖神經網路中,其效能顯著超越了之前的先進方法,並能有效預測各種糖類分子的結合位點。

結合誘變研究,DeepGlycanSite 揭示了重要 G 蛋白偶聯受體的鳥苷-5'-二磷酸糖識別位點。

這些發現表明 DeepGlycanSite 對於糖結合位點預測具有重要價值,並可以深入瞭解具有治療重要性蛋白質的糖類調節背後的分子機制。

該研究以「Highly accurate carbohydrate-binding site prediction with DeepGlycanSite」為題,於 2024 年 6 月 17 日釋出在《Nature Communications》。

圖片

糖在所有生物體的細胞表面普遍存在,它們與多種蛋白質家族如凝集素、抗體、酶和轉運蛋白相互作用,調節免疫反應、細胞分化和神經發育等關鍵生物學過程。理解糖類與蛋白質的相互作用機制是開發糖類藥物的基礎。

然而,糖類結構的多樣性和複雜性,尤其是它們與蛋白質結合位點的多變性,給實驗資料的獲取和藥物設計帶來了挑戰。

圖片

圖示:糖類分子的複雜性和糖結合位點的多樣性。(來源:論文)

過去,傳統的結合位點預測方法不適用於結構複雜、大小變化大的糖類分子。加之高解析度糖-蛋白質複合物結構資料的稀缺,導致預測模型的效能受限。

近年來,隨著蛋白質資料庫(PDB)和開放糖組學資源的快速發展,學界已經積累了超過 19000 個此類複合物的結構資料。這些高質量資料的增加,為採用 AI 技術開發精確的糖結合位點預測模型提供了可能,從而有望加速糖類藥物的發現和最佳化過程。

在最新的研究中,中國科學院團隊引入了 DeepGlycanSite,這是一種深度等變圖神經網路 (EGNN) 模型,能夠準確預測具有目標蛋白質結構的糖結合位點。

圖片

圖示:DeepGlycanSite 概述。(來源:論文)

該團隊利用幾何特徵(例如殘基內和殘基間的方向和距離)以及進化資訊,在 DeepGlycanSite 中以殘基級別的圖形表示形式呈現蛋白質。結合具有自注意力機制的 Transformer 塊來增強特徵提取和複雜關係發現。

在涉及一百多種獨特糖結合蛋白的獨立測試集上,研究人員將 DeepGlycanSite 與當前最先進的計算方法進行了比較。

結果顯示,DeepGlycanSite (0.625) 的平均馬修斯相關係數(MCC) 是 StackCBPred (0.018) 的 30 倍以上,同時遠超其他序列基礎的預測方法。

傳統配體結合位點方法可能因疏水性或小尺寸而排除簡單糖類分子的結合位點,而 DeepGlycanSite 則能有效識別這些位點。

圖片

圖示:比較模型在預測不同糖結合位點方面的表現。(來源:論文)

並且,DeepGlycanSite 在預測蛋白質上的多個糖結合位點方面也表現出色,這對於理解多價糖綴合物如何影響糖-蛋白相互作用以及生物過程的調控具有重要價值。例如,多價糖綴合物被設計成化學工具和藥物候選物,以影響糖類分子與凝集素之間的相互作用。

與傳統的僅使用蛋白質序列或結構資訊的方法不同,DeepGlycanSite 充分考慮了蛋白質的幾何資訊及進化特性,這可能是其表現優異的關鍵因素。

此外,給定查詢糖類分子的化學結構,DeepGlycanSite 還可以預測其特定結合位點。

圖片

圖示:查詢糖的特定結合位點預測。(來源:論文)

研究人員探索了 DeepGlycanSite 對功能重要的 G 蛋白偶聯受體 (GPCR) 的應用。利用 AlphaFold2 預測的蛋白質結構和糖類化學結構,DeepGlycanSite 成功檢測到了人類 P2Y14 上 GDP-Fuc 的具體結合位點。

圖片

圖示:DeepGlycanSite 的實驗驗證。(來源:論文)

雖然 AlphaFold2 預測的側鏈質量有待提高,但 DeepGlycanSite 對蛋白質結構準確性的依賴較低,能夠使用預測的蛋白質結構提供糖-蛋白相互作用的見解。

綜上所述,DeepGlycanSite 在獨立測試集和體外案例研究中的驗證表明,它是一個有效的糖結合位點預測工具。研究人員可以利用 DeepGlycanSite 預測目標蛋白質上的糖結合口袋,從而促進對糖-蛋白質相互作用的理解。

糖類在生物學功能中扮演著關鍵角色,DeepGlycanSite 不僅有助於解析糖類分子和糖結合蛋白的生物學功能,也為糖類藥物的開發提供了有力工具。

論文連結:https://www.nature.com/articles/s41467-024-49516-2

相關文章