識別精度高達76.32%,浙大、之江團隊用深度學習加速大規模藥物發現和再利用

ScienceAI發表於2024-08-28
圖片

編輯 | 蘿蔔皮

大規模藥物研發和再利用具有挑戰性。確定作用機制 (MOA) 至關重要,但目前的方法成本高昂且通量低。

在這裡,浙江大學、之江實驗室以及史丹佛大學的研究人員介紹了一種透過分析線粒體表型變化來識別 MOA 的方法。

透過對線粒體形態和膜電位進行時間成像,研究人員建立了監測時間分辨線粒體影像的流程,得到了一個資料集,其中包含 570,096 張暴露於 1,068 種美國食品和藥物管理局批准藥物的細胞單細胞影像。

該團隊開發了一種名為 MitoReID 的深度學習模型,該模型使用重新識別 (ReID) 框架和 Inflated 3D ResNet 主幹。它提供了一種自動化且經濟高效的靶標識別替代方法,可以加速大規模藥物發現和再利用。

該研究以「Deep learning large-scale drug discovery and repurposing」為題,於 2024 年 8 月 21 日釋出在《Nature Computational Science》。

圖片

線粒體形態、膜電位和氧化還原狀態已被用於識別功能化合物或遺傳擾動的影響;然而,過去的研究僅側重於提取有限數量的形態特徵,導致大量有助於改善目標識別的資訊丟失。

為了解決這一限制,浙江大學、之江實驗室以及史丹佛大學的研究人員在此引入了時間維度來評估暴露於具有不同作用機理的化合物後的線粒體形態和膜電位。

具體來說,研究人員生成了一個由 1,000 多種美國食品藥品管理局 (FDA) 批准的藥物治療的線粒體表型資料集,涵蓋 16 個時間點的 570,096 張單細胞影像。

傳統的機器學習技術無法充分割槽分線粒體表型和 MOA 之間的關係,因為在識別時間資料的複雜性方面缺乏相容性。

因此,該團隊透過一種名為 MitoReID 的深度學習模型開發了一種基於線粒體分析的 MOA 識別方法。透過將大規模縱向線粒體動力學監測與深度學習方法相結合,研究人員成功建立了一種快速、自動化、無偏的預測化學物質 MOA 的方法。

深度學習識別MOA框架

MitoReID 框架由四個基本部分組成。

首先,建立一個強大的細胞損傷模型,並將其暴露於 1,068 種 FDA 批准的藥物中,以觀察應激反應。透過嚴格的高通量方法,特別關注線粒體形態和膜電位,收集時間序列影像,作為原始資料集的基礎。

隨後,在重新識別 (ReID) 框架內對這些影像序列進行了創新的深度學習模型 MitoReID 的訓練。

在後續階段,使用訓練後的模型提取未見藥物和天然化合物的特徵。然後使用餘弦距離將這些特徵與 FDA 批准藥物的特徵進行匹配,並將與最接近的藥物相關的 MOA 推斷為預測。

最後,進行了體外生化實驗,以驗證未鑑定天然化合物的假設作用機理。

圖片

圖示:透過分析時間線粒體表型,基於深度學習的 MOA 預測框架可用於大規模藥物發現和重新利用。(來源:論文)

這個全面的概念框架提供了一種方法來觀察細胞對各種 FDA 批准的化合物和天然物質的複雜應激反應,有可能產生新的候選藥物並闡明以前未知的作用機理。

更高效更準確

經過評估,該演算法能夠將 477 種 FDA 批准藥物準確地分類為 38 種已知的 MOA,並正確識別六種未知的 FDA 批准藥物和數十種天然化合物的 MOA。

圖片

圖示:使用 MitoReID 根據時間線粒體表型將 477 種 FDA 批准的藥物分為 38 種 MOA。(來源:論文)

它在測試集上實現了 76.32% 的 Rank-1 和 65.92% 的平均精度,並根據線粒體表型成功識別了六種未經訓練的藥物的 MOA。

此外,MitoReID 還確定環氧合酶 2 抑制是茶中天然化合物表兒茶素的作用機制,並在體外成功驗證。

圖片

圖示:高通量採集時間線粒體表型的延時影像。(來源:論文)

MitoReID 表現出預測未見藥物和天然化合物的 MOA 的潛力,這可能促進基於細胞器表型相似性的大規模藥物發現和重新利用。

MitoReID 的一個突出優勢是它能夠捕捉全面的線粒體特徵,超越了傳統形態測量技術的能力。該模型自主學習並整合線粒體形狀和時間動態等全域性特徵,無需複雜的資料預處理、手動特徵提取或特徵選擇。

此外,透過利用 GPU 計算,模型的效率得到提高,即使在大量資料集上也能進行快速預測。

侷限性與未來方向

然而,必須承認,MitoReID 的效能會受到資料質量、實驗條件和標籤註釋等因素的影響。

影像模糊和實驗變化會極大地影響預測的準確性,因此需要採取嚴格的資料質量控制措施。此外,準確註釋時間線粒體表型仍然是一個挑戰,有必要進一步探索,為標記方法建立堅實的理論基礎。

為了應對 MitoReID 面臨的挑戰並進一步提高其效能,研究人員建議將藥物-靶點和藥物-疾病關係等更多資訊整合到深度學習方法中。

圖神經網路(GNN)為整合此類資訊提供了一條有希望的途徑。透過將這些寶貴的知識整合到 GNN 框架中,該團隊希望進一步增強 MitoReID 的效能,並提高其預測藥物靶標和藥物作用機制 (MOA) 的能力。此外,GNN 可以利用所有藥物影像來克服目前藥物作用機制 (MOA) 標記和分類的侷限性。

目前,只有當藥物具有完全相同的藥物作用機制 (MOA) 時,才會將其劃分為不同的類別,而忽略某些藥物可能具有重疊的藥物作用機制 (MOA) 集這一事實。

GNN 可以克服這一限制,並根據共享的藥物作用機制特徵為藥物建立更細緻入微的分類框架。研究人員表示,接下來要尋求改進和擴充套件 MitoReID 的功能,這種現有知識與先進的深度學習技術的整合將成為他們未來研究工作的重點。

圖片

圖示:具有不同作用機理的藥物表現出不同的線粒體表型。(來源:論文)

此外,該團隊的資料集具有巨大的潛力,可以識別對心血管系統和其他線粒體疾病產生積極或消極影響的藥物。透過分析與特定疾病相關的藥物表型特徵,研究人員可以發現潛在的治療候選藥物或識別不良反應。

該資料集的全面性(結合 MitoReID 的強大功能)使研究人員能夠研究藥物誘導表型與疾病結果之間的複雜關係。這一研究方向對於發現治療干預措施和最佳化治療策略具有巨大的前景。

研究人員在論文裡表示:「透過不斷改進和擴充套件我們的方法,融入人類知識,並採用 GNN 等新興技術,我們期待進一步取得突破,為開發更有效、更有針對性的治療方法做出貢獻。這種多學科方法彌合了計算分析和生物領域專業知識之間的差距,有助於推動藥物發現的進步。」

論文連結:https://www.nature.com/articles/s43588-024-00679-4

相關文章