Science | 深度學習為3億年的大腦進化提供了新視角

ScienceAI發表於2025-02-25

圖片

編輯 | 白菜葉

在《Science》雜誌發表的一項新研究中,比利時的一個研究小組探索了控制基因活動的基因開關如何定義不同物種的腦細胞型別。

他們用人類、小鼠和雞的大腦資料訓練了深度學習模型,發現雖然某些細胞型別在經過數百萬年的進化後在鳥類和哺乳動物之間得到了高度保守,但其他細胞型別卻以不同的方式進化。

這些發現不僅為大腦進化提供了新的見解,還為研究基因調控如何塑造不同細胞型別、跨物種或不同疾病狀態提供了強有力的工具。

該研究以「Enhancer-driven cell type comparison reveals similarities between the mammalian and bird pallium」為題,於 2025 年 2 月 14 日釋出在《Science》。

圖片

我們的大腦,乃至整個身體,都是由許多不同型別的細胞組成的。雖然它們共享相同的 DNA,但所有這些細胞型別都有自己的形狀和功能。

每種細胞型別的不同之處是一個複雜的謎題,研究人員幾十年來一直在試圖從充當開關的短 DNA 序列中解開謎團,這些序列控制著哪些基因被開啟或關閉。

這些開關的精細調節確保每種腦細胞都能使用來自基因組的正確遺傳指令來發揮其獨特作用。科學家將這些基因開關的獨特模式稱為調控程式碼。

VIB Center for AI & Computational Biology 和 VIB-KU Leuven Center for Brain & Disease Research 的 Stein Aerts 教授,他的團隊研究了這種調控程式碼的基本原理,以及它如何影響癌症或腦部疾病等疾病。

他們開發了新的深度學習方法,用來理解從成千上萬個單個細胞中收集的大量基因調控資訊。

「使用 DNA 序列程式碼的深度學習模型極大地幫助我們識別了不同細胞型別的調控機制。」Aerts 解釋道,「現在,我們想探索這種調控程式碼是否也能告訴我們這些細胞型別是如何在物種間保守的。」

大腦就是一個與此問題高度相關的示例。儘管哺乳動物和鳥類的大腦有著共同的發育軌跡,但它們的神經解剖結構卻截然不同。Aerts 團隊現已應用深度學習模型來評估現有的差異和相似之處是否反映在共同或不同的監管程式碼中。

研究進化的工具

Nikolai Hecker 和 Niklas Kempynck 分別是 Aerts 實驗室的博士後和博士生,他們開發並實施了機器學習模型,以描述和比較人類、小鼠和雞腦中不同型別的細胞,涵蓋了約 3.2 億年的進化過程。

圖片

圖示:鳥類和哺乳動物端腦調控程式碼之間的對應關係暗示了祖先的保護。(來源:論文)

但在真正進行比較之前,他們首先必須更好地瞭解雞腦的細胞型別組成。為了表徵和比較哺乳動物和鳥類大腦皮層中腦細胞型別的增強子程式碼,該團隊生成了雞端腦的單細胞多組學 (scMultiome) 和空間解析轉錄組學資料。

作為繪製物種間細胞型別相似性的基線,他們比較了人類、小鼠和雞端腦細胞型別的轉錄組。然後,他們使用可變染色質可及性作為代理來識別潛在的基因組增強子區域並評估其細胞型別特異性。

接下來,研究人員在這些區域上訓練了基於序列的深度學習模型,以推斷人類、小鼠和雞端腦細胞型別特異性增強子程式碼。

「我們的研究展示了我們如何使用深度學習根據其調控程式碼來表徵和比較不同型別的細胞。」Hecker 解釋道,「我們可以利用這些程式碼來比較不同物種的基因組,確定哪些調控程式碼在進化過程中得以保留,並深入瞭解細胞型別是如何進化的。」

雞端腦的興奮性神經元明顯定位於皮質神經解剖區域,包括中皮質、內皮質、超皮質和巢皮質。根據轉錄組和增強子程式碼比較,非神經元和 γ-氨基丁酸介導(GABAergic)細胞型別在鳥類和哺乳動物中表現出高度相似性,這反映在這些細胞型別的保守 TF 組合上。

另一方面,哺乳動物和鳥類大腦皮層中興奮性神經元的增強子程式碼表現出更高的分化程度。這些匹配僅部分符合現有的基於發育軌跡和腦回路的脊椎動物大腦皮層細胞型別同源性的進化模型。

研究小組發現,儘管鳥類和哺乳動物之間某些調節細胞型別的程式碼高度保守,但其他型別的程式碼卻以不同的方式進化。值得注意的是,某些鳥類神經元的調節程式碼與哺乳動物新皮層深層神經元的調節程式碼相似。

「直接檢視調控程式碼具有顯著的優勢。」Kempynck 補充道,「它可以告訴我們哪些調控原則是跨物種共享的,即使 DNA 序列本身發生了變化。」

這些調控資訊不僅有助於理解進化,還非常有用。在之前的研究中,Aerts 團隊已經證實,哺乳動物和斑馬魚之間保留了黑色素瘤(皮膚癌)細胞狀態的調控程式碼。他們還發現了黑色素瘤患者基因組中的變異。

當前研究中提出的腦細胞型別模型為研究基因組變異的影響及其與心理或認知特徵和障礙的關聯提供了有用的工具。

Aerts 表示:「最終,學習基因組調控程式碼的模型有可能篩選基因組並研究任何物種中特定細胞型別或細胞狀態的存在與否。這將成為研究和更好地瞭解疾病的有力工具。」

Aerts 團隊已經在兩個方面應用他們的模型。他說:「透過與動物園科學和野生動物救援中心合作,我們現在正在將我們的進化模型擴充套件到更多動物的大腦:從不同型別的魚到鹿、刺蝟和水豚。與此同時,我們還在探索這些人工智慧模型如何幫助揭示與帕金森病相關的遺傳變異。」

論文連結:https://www.science.org/doi/10.1126/science.adp3957

相關報導:https://phys.org/news/2025-02-deep-view-million-years-brain.html

相關文章