Nature子刊,川大團隊機器學習結合MD,預測蛋白質變構,助力藥物研發

ScienceAI發表於2024-09-25

圖片

編輯 | 蘿蔔皮

變構藥物為現代藥物設計提供了一條新途徑。然而,識別隱蔽的變構位點是一項艱鉅的挑戰。

四川大學蒲雪梅教授、邵振華研究員團隊提出了一種先進的計算流程,結合殘基驅動的混合機器學習模型(RHML)和分子動力學(MD)模擬,成功識別出了變構位點、變構調節劑,並揭示了它們的調控機制。

具體而言,在 β2 腎上腺素能受體(β2AR)中,團隊發現了位於殘基 D79^2.50、F282^6.44、N318^7.45和S319^7.46 附近的一個新的變構位點及潛在調節劑 ZINC5042。透過分子力學/廣義 Born 表面積(MM/GBSA)和蛋白質結構網路(PSN)的分析,進一步揭示了變構效力及調控機制。

該研究以「Integrative residue-intuitive machine learning and MD Approach to Unveil Allosteric Site and Mechanism for β2AR」為題,於 2024 年 9 月 16 日釋出在《Nature Communications》。

圖片

變構作用是一種關鍵的生物調控機制,涉及遠端位點的結構和動態變化,廣泛存在於各種生物過程中。變構藥物透過非競爭性結合調節蛋白活性,具有更高的選擇性和更低的毒性,已用於治療癌症、神經精神疾病和免疫疾病。

雖然 MD 模擬可幫助識別隱匿的變構位點,但其資料量大,難以手動分析,並可能受人為偏見影響。為此,結合機器學習可提高識別變構位點的效率,併為藥物開發提供新方法,尤其是針對 GPCR 類藥物,如 β2AR 的變構位點識別,具有重要意義。然而,現有方法仍存在侷限性,需要進一步發展無偏通用的識別方法。

在最新的研究中,四川大學蒲雪梅、邵振華團隊結合無監督聚類和可解釋的深度學習多分類模型,探索了一種殘差直觀混合機器學習(稱為 RHML)框架。

透過該框架,研究人員可以解決類別標籤缺失的問題,實現具有殘基級可解釋性的準確分類,從而識別涉及變構位點的重要殘基。

圖片

圖示:框架概述。(來源:論文)

具體來說,首先進行廣泛的高斯加速分子動力學 (GaMD) 模擬以增強取樣,從而構建足夠的構象空間。利用構象空間,構建了一個殘基直觀混合機器學習(RHML)框架,該框架由無監督聚類和基於可解釋卷積神經網路(CNN)的多分類器組成。

使用 RHML,研究人員可以確定最佳簇數(標籤)和變構位點開啟時的構象狀態。然後,透過 FTMap 結合 RHML 的 LIME 直譯器識別變構位點。根據識別的變構位點,從兩個化合物資料集中篩選出潛在的變構調節劑。

透過常規 MD(cMD)、結合能分析、結構分析和調控通路分析進一步探討變構位點/藥物的調控作用及其調控通路。

最後,透過 cAMP 積累試驗、β-arrestin 募集試驗和定點誘變實驗進行實驗驗證。總的來說,這項工作涉及六個系統、15 μs GaMD 模擬和 22.5 μs cMD 模擬。

在確定假定的變構位點和篩選相關的調節劑之後,研究人員進一步探究它們與正構位點和活性區域等功能域的通訊。

圖片

圖示:可解釋的基於 CNN 的多分類模型的架構。(來源:論文)

該團隊的目標是進一步預先評估作為變構位點/調節劑的潛力並揭示它們的調控機制,這對於確保預測成功率和合理設計蛋白質的變構性至關重要,但在以前的變構藥物設計方法中經常被忽視。

為了驗證該識別策略的有效性,研究人員選取 G 蛋白偶聯受體(GPCR)家族中的β2腎上腺素受體(β2AR)作為研究物件,發現了 β2AR 的一個變構位點和一個負變構調節劑(ZINC5042),並透過細胞功能實驗對其進行了驗證。

圖片

圖示:變構位點和藥物篩選策略。(來源:論文)

得益於技術優勢,RHML 揭示了 β2AR 和其他 GPCR 中以前未報導過的變構位點。額外的變構位點位於殘基 D79^2.50、F282^6.44、N318^7.45 和 S319^7.46 周圍,研究人員利用虛擬篩選發現了假定的變構調節劑 ZINC5042。

在大量 cMD 模擬、MM/GBSA 和 PSN 的幫助下,研究人員進一步探討了變構位點/調節劑與正構位點/激動劑之間的通訊,這對於進一步估計變構潛力以提高變構位點/藥物識別的成功率具有重要意義。

MM/GBSA 顯示 ZINC5042 以負協同方式減弱正位激動劑與 β2AR 的結合。結構分析表明 ZINC5042 阻礙了鈉離子結合口袋的坍塌和PIF基序向活性態的構象轉變,從而驅動受體構象向非活性態轉變。

PSN 表明變構調節劑 ZINC5042 結合會降低螺旋結構間的通訊,從而不利於激動劑刺激的啟用訊號傳導。此外,還鑑定了一些重要的變構調節殘基。

基於充分的計算證據,基於 Glosensor 的 cAMP 測定和定點誘變實驗強有力地驗證了對變構位點和負變構效應的計算預測,清楚地證實了所鑑定的關鍵殘基 D79^2.50,F282^6.44,N318^7.45 和 S319^7.46 確實在結合變構調節劑和抑制正構激動劑誘導的活化訊號傳導中發揮重要作用,特別是對於 F282^6.44。

圖片

圖示:ZINC5042 的效力和變構位點的實驗驗證。(來源:論文)

總體而言,該識別流程解決了現有 ML 模型在 MD 構象分析中的侷限性,包括最佳類別數、構象表示中的資訊丟失和基於殘基的預測結果解釋。因此,RHML 能夠對任何 MD 軌跡進行準確的構象分類和識別決定不同構象類別的重要殘基。

該團隊還上傳了一個使用者友好的殘基直觀混合機器學習框架程式碼。該程式碼提供可自定義的輸入選項,自動生成可讀的輸出檔案,其中包括簇類別和決定分類的重要殘基。

圖片

圖示:RHML 獲取。(來源:網頁)

研究人員期望它將成為 MD 領域的一種有價值的工具,用於輔助變構位點識別和與構象分析相關的其他 MD 任務。

框架程式碼:https://github.com/chyannn06/RHML

論文連結:https://www.nature.com/articles/s41467-024-52399-y

相關文章