重建170萬個細胞發育軌跡,支援多模態,AI繪製細胞時空圖譜,登Nature

ScienceAI發表於2025-02-20

圖片

編輯 | 蘿蔔皮

單細胞基因組技術能夠跨時間和空間維度對數百萬個細胞進行多模態分析。

不過,實驗限制阻礙了在天然時間動態和天然空間組織環境中對細胞進行全面測量。

最佳運輸是解決這些限制的有力工具,並有助於恢復原始細胞環境。然而,大多數最優傳輸應用無法整合多模態資訊或擴充套件到單細胞圖譜。

在這裡,來自慕尼黑工業大學(TUM)、慕尼黑亥姆霍茲大學、蘇黎世聯邦理工學院等組成的跨學科研究團隊提出了多組學單細胞最優傳輸(Moscot,Multi-Omics Single-Cell Optimal Transport),這是一個可擴充套件的單細胞基因組學最優傳輸框架,支援所有應用中的多模態性。

研究表明 Moscot 能夠有效重建 20 個時間點的 170 萬個小鼠胚胎細胞的發育軌跡。

該研究以「Mapping cells through time and space with moscot」為題,於 2025 年 1 月 22 日釋出在《Nature》。

圖片

單細胞基因組技術增進了科學家對細胞分化和組織組織動態的理解。單細胞分析(如單細胞 RNA 測序 (scRNA-seq))可以高解析度分析單個細胞的分子狀態,而空間分析可以恢復其空間組織。然而,這些實驗涉及細胞破壞,並且僅捕獲一小部分分子資訊。因此,必須重新調整細胞圖譜。

先前的研究透過使用最優傳輸 (OT) 解決了這些問題,這是一個涉及對映和比較機率分佈的領域。OT 在描述細胞重程式設計過程、透過使用單細胞參考增強空間資料重建組織結構以及透過對齊空間轉錄組資料構建生物系統的通用座標框架 (CCF) 方面發揮了重要作用。

雖然基於 OT 的方法有潛力解決單細胞基因組學中的對映問題,但它們的使用面臨三個關鍵挑戰:首先,基於 OT 的工具的實現面向單峰資料。其次,當前在單細胞基因組學中使用的 OT 方法計算成本高昂。第三,現有工具建立在異構實現的基礎上,這使得很難調整或組合新問題的方法。

「現有的方法只能提供少數細胞的快照,或者無法將空間和時間上的動態過程聯絡起來。」這項研究的主要作者之一、亥姆霍茲慕尼黑計算生物學研究所的博士候選人、慕尼黑工業大學(TUM)的研究員 Dominik Klein 解釋說,「這極大地限制了我們對器官發育和疾病過程中複雜相互作用的理解。」

Dominik Klein 與 Giovanni Palla(慕尼黑亥姆霍茲大學)、Marius Lange(蘇黎世聯邦理工學院)、Michal Klein(蘋果公司)和 Zoe Piran(耶路撒冷希伯來大學)領導的跨學科團隊一起開發了 Moscot。該團隊借鑑了 18 世紀發展起來的一項理論:最優傳輸理論,該理論描述了物體如何以最高效的方式從一個地方移動到另一個地方,以最大限度地減少時間、能源或成本。

Moscot 基於三個設計原則來克服當前的侷限性。Moscot 支援多模態資料,提高了可擴充套件性,並統一了 OT 在時間和空間域中的先前單細胞應用。團隊還引入了以前未描述的時空應用。直觀的應用程式程式設計介面 (API) 與更廣泛的 scverse 生態系統互動,使這些功能變得可用。

圖片

圖示:Moscot 可在單細胞應用中實現高效的多模態 OT。(來源:論文)

Moscot

具體而言,Moscot 將生物對映和比對任務轉化為 OT 問題,並使用一組一致的演算法來解決這些問題。Moscot 將不成對的資料集作為輸入,同時接受生物學知識(例如細胞生長率)來指導對映過程。

它解決了 OT 問題並生成了耦合矩陣,該矩陣以機率方式關聯每個資料集中的樣本。有了該耦合矩陣,Moscot 提供了各種特定於應用的下游分析功能。

Moscot 以三種 OT 概念為基礎,以解決各種生物學問題。這些概念在樣本跨細胞分佈的關聯方式上有所不同:

Wasserstein 型 (W 型) OT 比較兩組具有相同細胞特徵的細胞;

Gromov–Wasserstein 型 (GW 型) OT 比較生活在不同空間的細胞分佈;

融合 Gromov–Wasserstein 型 (FGW 型) OT 比較具有部分共同特徵的細胞。

為了在整個框架中支援多模態性,研究人員使用了共享潛在表示。與之前基於 OT 的工具相比,該團隊將 W 型、GW 型和 FGW 型概念的計算時間和記憶體消耗減少了幾個數量級,從而使 Moscot 適用於圖集規模的資料集。

驗證與應用

團隊透過研究小鼠胚胎髮育過程中 170 萬個細胞的生長情況來展示 Moscot 的功能。

圖片

圖示:Moscot 繪製了圖集尺度的胚胎細胞生長軌跡。(來源:論文)

此外,研究人員將透過測序 (CITE-seq) 對轉錄組和表位進行多模態細胞索引的資訊對映到小鼠肝臟的高解析度空間讀數,並將小鼠腦樣本的大空間轉錄組切片對齊。

研究人員聯合分析了小鼠胰腺發育過程中的基因表達和染色質可及性,並應用 Moscot 更好地描繪 delta 細胞和 epsilon 細胞的細胞軌跡。

該研究證實,NEUROD2 是人類誘導多能幹細胞胰島細胞分化模型中 epsilon 祖細胞的調節劑。

Moscot 的應用為胰腺研究提供了新的見解:該團隊成功地基於多模態測量繪製了胰腺中激素產生細胞的發育圖。基於這些發現,科學家現在可以詳細分析糖尿病的潛在機制。

在 SPATEO 的同時,團隊引入了時空對映的概念,並使用小鼠胚胎發生的時空圖譜展示了其優勢。

「這種對細胞過程的新視角為針對性治療開闢了機會,這種治療可以解決疾病的根本原因,而不僅僅是治療症狀。」亥姆霍茲慕尼黑糖尿病和再生研究所所長 Heiko Lickert 教授說。

圖片

圖示:使用 Moscot 推斷時空動態。(來源:論文)

結語

總之,研究人員基於 OTT 開發了 Moscot,它是 OT 演算法的可擴充套件 JAX 實現,支援即時編譯、成本函式的動態評估和 GPU 加速。

當適應資料集的大小時,研究人員將耦合矩陣限制為低秩,這使得 W 型、GW 型和 FGW 型概念具有線性時間和記憶體複雜度。

統一的 API 使得 Moscot 易於使用和擴充套件。特別是,模組化實現使得可以使用類似的基礎設施來解決不同的生物學問題。目前,Moscot 可作為開源軟體使用。

Moscot:https://moscot-tools.org

論文連結:https://www.nature.com/articles/s41586-024-08453-2

相關報導:https://phys.org/news/2025-01-ai-cell-technology-reveals-dynamics.html

相關文章