準確率82.5%,設計多藥理學化合物,加州大學開發新AI平臺設計未來抗癌藥物

ScienceAI發表於2024-05-23
圖片

編輯 | 蘿蔔皮

多藥理學藥物(可以同時抑制多種蛋白質的化合物)在治療癌症等重大疾病方面有著重要應用,但非常難以設計。

為了應對這一挑戰,加州大學聖地亞哥分校的研究人員開發了 POLYGON,這是一種基於生成強化學習的多藥理學方法,可以模擬藥物發現最早階段所涉及的耗時化學過程。

POLYGON 嵌入化學空間並對其進行迭代取樣,從而生成新的分子結構;這些藥物的回報是預期能夠抑制兩個蛋白質靶標中的每一個,並且具有藥物相似性和易於合成的特點。

在超過 100,000 種化合物的結合資料中,POLYGON 能夠正確識別多藥理學相互作用,準確率達 82.5%。研究人員用它生成了,針對十對具有相互依賴關係蛋白質的從頭設計化合物。對接分析表明,頂部結構以低自由能結合靶標。

該團隊還合成了 32 種針對 MEK1 和 mTOR 的化合物,其中大多數在劑量為 1–10μM 時,每種蛋白質活性和細胞活力降低了 50% 以上。

該研究以「De novo generation of multi-target compounds using deep generative chemistry」為題,於 2024 年 5 月 6 日釋出在《Nature Communications》。

圖片

經典藥物發現採用「一種疾病:一種靶標:一種藥物」模型。雖然這種模型已經產生了許多成功的治療方法,但許多疾病並沒有單一的分子原因,而是與各種潛在的干預點相關,每個干預點都可能對疾病病因產生部分影響。

對於癌症和精神疾病等多基因疾病來說,這種困難尤其明顯,這些疾病整合了複雜生物網路中組織的許多基因的功能效應。應對這些問題,多藥理學是一種重要的解決方案。

多藥理學化合物的主要障礙是需要設計一種同時有效抑制多種蛋白質的單一藥物。有效的多藥理學設計,例如針對甲狀腺癌中的 RET 和 VEGFR2 的藥物,需要大量的時間和資源才能確定合適的命中支架。由於這些原因,此類化合物很大程度上是偶然發現的,而不是系統發現的。

為了實現新的多藥理學化合物的程式設計生成,加州大學聖地亞哥分校的研究團隊開發了 POLYGON(POLYpharmacology Generative Optimization Network),這是一種基於生成人工智慧強化學習的深度機器學習模型。

圖片

圖示:使用 POLYGON 驗證特定化合物雙靶點活性。(來源:論文)

「幾年前,人工智慧在製藥行業是一個骯髒的詞,但現在的趨勢卻截然相反。生物技術初創公司發現如果不在其商業計劃中提及人工智慧就很難籌集資金。」論文的通訊作者,加州大學聖地亞哥分校醫學系教授、生物工程和電腦科學兼職教授 Trey Ideker 說,「人工智慧引導的藥物發現已成為行業中非常活躍的領域,但與公司開發的方法不同,該技術將會開源,任何人都可以使用。」

POLYGON 的組成

POLYGON 的核心部分是一個變分自編碼器(VAE),這是一種深度神經網路,它將分子化合物的化學結構轉換為「化學嵌入」(chemical embedding)。這個過程涉及將複雜的化學結構對映到低維空間中,使得相似的化學結構在嵌入空間中接近。

圖片

圖示:嵌入化學空間以生成多藥理藥物的發現。(來源:論文)

VAE 包含兩個門控迴圈單元遞迴神經網路(GRU-RNNs),分別作為編碼器和解碼器。編碼器將分子x轉換為機率分佈 z,代表化學嵌入中的點;解碼器則將這些嵌入座標重新轉換為有效的分子結構 x'。

訓練過程中,VAE 最佳化兩個損失函式:一個減少重構誤差,確保解碼後的分子接近原始輸入;另一個是 Kullback-Leibler 散度,促使嵌入分佈接近正態分佈。

POLYGON 的第二個關鍵元件是基於強化學習的系統,用於生成對兩個不同靶點具有活性的多靶點藥物分子。該系統透過迭代方式工作,每次迭代時隨機從化學嵌入空間中取樣分子,並根據它們對兩個特定靶標的預測抑制能力、合成可行性和藥物類屬性等多個獎勵標準進行評分。高分分子的座標被用來定義嵌入空間的子區域,用於模型的再訓練和後續迭代中的隨機取樣,以此平衡利用現有知識與探索未知化學空間的需求。

POLYGON 的應用

POLYGON 在藥物發現人工智慧工具中是獨一無二的,因為它可以識別具有多個靶點的分子,而現有的藥物發現協議目前優先考慮單靶點療法。多靶點藥物可以提供與聯合療法(幾種不同的藥物一起使用)相同的治療效力,但副作用更少。

「尋找和開發一種新藥需要多年時間和數百萬美元,特別是當我們談論的是具有多個靶點的藥物時。」Ideker說,「我們所擁有的罕見的多靶點藥物很大程度上是偶然發現的,但這項新技術可以幫助擺脫偶然性並啟動新一代精準醫學。」

研究人員利用 POLYGON 生成了一系列針對 10 對合成致命癌症蛋白的從頭分子化合物,並透過包括 3D 分子對接分析在內的多種方法對其進行評估。

圖片

圖示:肖像與小分子的生成模型。(來源:論文)

「就像人工智慧現在非常擅長生成原始圖片,例如根據年齡或性別等所需屬性建立人臉圖片,POLYGON 能夠根據所需化學屬性生成原始分子化合物。」Ideker 說,「在這種情況下,不是告訴人工智慧我們希望臉看起來有多大,而是告訴它我們希望未來的藥物如何與疾病蛋白質相互作用。」

圖片

圖示:從頭設計和合成 mTOR/MEK1 抑制劑。(來源:論文)

該團隊合成了 32 種 POLYGON 化合物,用於雙重抑制 MEK1 和 mTOR。這兩種蛋白質被科學家稱為綜合致死蛋白,這意味著同時抑制這兩種蛋白質就足以殺死癌細胞,即使單獨抑制其中一種還不足以殺死癌細胞。隨後研究人員在無細胞測定和肺腫瘤細胞中對其進行了驗證。

「一旦你有了候選藥物,你仍然需要進行所有其他化學反應,將這些選擇細化為單一、有效的治療方法。」Ideker說,「我們不能,也不應該試圖從藥物發現管線中消除人類的專業知識,但我們可以做的是縮短這一過程的幾個步驟。」

儘管存在這種謹慎,研究人員仍樂觀地認為人工智慧用於藥物發現的可能性才剛剛被探索。

「看到這個概念在未來十年如何在學術界發揮作用,將是非常令人興奮的。」Ideker說,「可能性幾乎是無限的。」

論文連結:https://www.nature.com/articles/s41467-024-47120-y

相關報導:https://phys.org/news/2024-05-simulated-chemistry-ai-platform-tomorrow.html

相關文章