輝瑞 AI 方法登 Science,揭示數以萬計的配體-蛋白質相互作用

ScienceAI發表於2024-04-26

圖片

編輯 | X

儘管蛋白質結構預測取得了重大進展。但對於 80% 以上的蛋白質,迄今為止尚未發現小分子配體。識別大多數蛋白質的小分子配體仍具有挑戰性。

現在,奧地利科學院分子醫學研究中心 CeMM 的研究人員與輝瑞公司合作,開發了一種方法來預測數百種小分子與數千種人類蛋白質的結合活性。

這項大規模研究揭示了數以萬計的配體-蛋白質相互作用,透過探索這些相互作用,從而可以開發化學工具和治療方法。

此外,在機器學習和人工智慧的支援下,它可以「公正」地預測小分子如何與活體人類細胞中存在的所有蛋白質相互作用。

相關研究以《Large-scale chemoproteomics expedites ligand discovery and predicts ligand behavior in cells》為題,於 4 月 26 日發表在《Science》雜誌上。

圖片

論文連結:https://www.science.org/doi/10.1126/science.adk5864

大多數藥物都是影響蛋白質活性的小分子。如果充分理解這些小分子,它們也是表徵蛋白質行為和進行基礎生物學研究的寶貴工具。

鑑於這些重要作用,令人驚訝的是,對於 80% 以上的蛋白質,迄今為止尚未發現小分子結合物。這阻礙了新藥和治療策略的開發,同樣也阻礙了對健康和疾病的新生物學見解。

圖片

圖示:配體發現方法的示意圖。(來源:論文)

為了縮小這一差距,CeMM 的研究人員與輝瑞公司合作擴大並擴充套件了一個實驗平臺,使他們能夠預測數百種具有不同化學結構的小分子如何與活細胞中所有表達的蛋白質相互作用。

這產生了數以萬計的配體-蛋白質相互作用的豐富目錄,現在可以進一步最佳化這些目錄,來代表進一步治療開發的起點。

具體而言,研究人員使用化學蛋白質組學方法來繪製人類蛋白質組中蛋白質-配體相互作用的圖譜。透過附著在光活化交聯劑的約 400 個配體片段的文庫,作者鑑定了約 2500 個蛋白質中的約 50,000 個具有統計顯著性的相互作用,其中包括大部分之前沒有已知配體的靶標。

並透過生化實驗驗證了這些結果,從篩選中鑑定出 E3 連線酶粘合劑和跨膜轉運蛋白抑制劑。

整合機器學習二元分類器進一步實現了細胞中片段行為的可解釋預測。由此產生的片段-蛋白質相互作用和預測模型的資源將有助於闡明分子識別原理,並加快迄今為止未藥物化的蛋白質的配體發現工作。

在該研究中,由 CeMM PI Georg Winter 領導的團隊透過開發細胞轉運蛋白的小分子結合物、細胞降解機制的成分,以及參與細胞訊號轉導的未被充分研究的蛋白質來證明這一點。

圖片

圖示:片段混雜預測。(來源:論文)

此外,利用大資料集,開發了機器學習和人工智慧模型,可以預測其他小分子如何與活人類細胞中表達的蛋白質相互作用。

研究人員利用完全功能化片段(Fully functionalized fragment,FFF)描述符,將其與一個快速、輕量級、全自動的 ML 演算法相結合,用於二元分類。

簡而言之,首先根據蛋白質相互作用計數的閾值將篩選的片段標記為混雜(1)或非混雜(0)。然後,使用基於 Transformer 的 ML 模型(TabPFN)將化合物的 FFF 描述符對映到分類分數(0 或 1)。

TabPFN 是一個完全學習的模型,它近似於貝葉斯推理,不需要超引數調優,因此可以根據化學蛋白質組學分析資料直接獲得高效能的 ML 分類器。

透過這種方法,混雜模型還可以瞭解結合蛋白質的特異性。

「我們驚訝地發現 AI 和機器學習如何提高我們對人類細胞中小分子行為的理解。我們希望我們的小分子-蛋白質相互作用目錄和相關的 AI 模型現在可以為藥物發現方法提供一條捷徑。」Winter 說。

為了最大限度地發揮科學界的潛在影響和實用性,所有資料和模型都透過網路應用程式免費提供(開源地址:https://ligand-discovery.ai)。

輝瑞公司副總裁兼藥物設計主管 Patrick Verhoest 博士說。「這是工業界和學術界的傑出合作。我們很高興向大家展示,我們團隊三年密切合作所取得的成果。這是一個偉大的專案。」

參考內容:https://phys.org/news/2024-04-shortcut-drug-discovery-method-large.html

相關文章