用CNN識別大腦神經元突觸連線

機器之心分析師發表於2018-08-22

發表於 Nature Methods 的一篇論文提出了一個使用深度卷積神經網路隨機森林分類器的框架 SyConn,可自動識別線粒體、突觸和它們的細胞型別,從而得到有豐富註釋的突觸連線矩陣。

論文:https://www.nature.com/articles/nmeth.4206

引言

人腦是一個智慧的複雜機器。從某些方面看,這個比喻是準確的,併為研究者提供了一種關聯我們的大腦的方法。我的大腦可分為 4 部分:額葉、頂葉、顳葉和枕葉。這種劃分方式的一大指標是功能——即該區域負責執行怎樣的任務。比如,顳葉通常與聽覺處理和嗅覺有關,枕葉通常與視覺資訊處理相關。

但是,大腦中的大部分神經行為都非常複雜,不同程度地涉及到多個大腦區域。而且不同的功能並不侷限於特定的大腦區域。模糊不清的情況到處存在。因此,當出現一種與大腦相關的疾病時,就會出現功能性缺陷,而從巨集觀角度卻難以找到其潛在原因。再回到機器的比喻,科學家現在在思考能否在微觀層面消除其中的“模糊性”,即研究大腦的基本單元(神經元)之間的連線。連線組(connectome)是大腦中神經連線的完整地圖,能展現神經元彼此連線以及助力不同功能的方式。用CNN識別大腦神經元突觸連線

體積電子顯微鏡

體積電子顯微鏡(volume EM)是一種常用的神經迴路重建技術。體積電子顯微鏡會使用大腦體積的三維電子顯微鏡成像來重建神經形狀和連線情況的細節。體積電子顯微鏡的不同之處最早是為檢查中樞神經系統(CNS)開發的。正如引言中提到的那樣,許多神經退行性疾病無法以自上而下的方式追蹤。因此,有必要以足夠的解析度分析軸突、樹突和單個突觸活動。

相比於組織檢查中常用的熒游標記方法,標準電子顯微鏡不會受到稀疏標記或超高解析度光學成像的要求的限制。這些染色可能得到所有膜和突觸的相對無偏差的染色。因此,體積電子顯微鏡可用於建模完整的突觸前和突觸後神經元連線。這也是可用於體積中所有神經元的一種標準操作,這允許我們構建完整的連線圖,即大腦的連線組。

隨著資料處理技術的發展,近年來定量方法已變得愈漸重要。體積電子顯微鏡能夠基於大資料集實現解剖學上的迴路重建,從而提供之前無法獲得的神經元計算方面的見解。隨著體積電子顯微鏡的發展進步以及計算能力的增長,現在已能通過足夠規模的資料集重建完整的神經元微迴路。這些新發現已經為多項研究提供了支援,並且表明解剖學上的迴路重建確實能幫助科學家理解神經元計算。

突觸連線推理流程(SyConn)

脊椎動物和無脊椎動物的神經系統密集地堆積著交織的神經元,它們的軸突、樹突和突觸相互連線或重疊在一起。因此,想要搞清楚大量神經元之間的連線詳情並非易事。根據從體積電子顯微鏡獲取的大資料集重建的連線組是一個高維網路,這意味著分析它將需要大量時間和精力。儘管技術進步已經幫助我們解決了獲取足夠的高解析度資料的問題,但分析這些資料還仍然是個問題。如圖 1 所示,如果我們想要以人工分析方式重建完整細節,那將耗費數以百萬計的小時數。

用CNN識別大腦神經元突觸連線

圖 1:人工分析不同資料集所需的估計時間。其中 j0126 是斑胸草雀的資料集,其中包含 21,850 個神經元片段;斑馬魚幼蟲大腦資料集有 100,000 個神經元;小鼠大腦灰質資料集有 71,000,000 個神經元。上面的彩色橫條表示 SyConn 自動化了除初始人工骨架重建(紅色)之外的所有步驟(綠色)。各列給出了基於體積電子顯微鏡資料集生成連線矩陣所需的步驟。

因此,必須開發一種能夠自動分析所有可用資料的方法,以讓連線組的構建更加可行。在這篇論文中,研究者開發了一個自動化突觸連線推理流程(SyConn),其需要所生成的神經突骨架和分類器訓練資料作為輸入,能夠得到有豐富註釋的連線圖,即連線組的組分。在這個推理流程,骨架會在第一步被轉換為體積重建,之後是突觸和影象資料中其它超微結構的物件,比如囊泡和線粒體。對超微結構的檢測能進一步增強神經突重建。

SyConn 框架使用了深度卷積神經網路(CNN)和隨機森林分類器來自動識別線粒體、突觸和它們的細胞型別,從而得到有豐富註釋的突觸連線矩陣。研究者專門開發了一個高階卷積神經網路庫 ElektroNN 並將其整合到了 SyConn 中,可有效使用圖形處理單元(GPU)來進行計算。通過去除多餘的計算和稀疏的訓練標籤,ElektroNN 針對大資料集上的訓練進行了優化,能降低模型訓練時間,實現更快的推理。

用CNN識別大腦神經元突觸連線

圖 2:與突觸後神經元接觸的突觸前神經元圖示。囊泡向突觸間隙傳遞神經遞質,其中攜帶了生物化學資訊。作為能量供給器的線粒體也具有豐富的功能。

為了將骨架轉換成體積重建,研究者訓練了一個遞迴式 3D CNN 模型來檢測神經突之間的屏障區域(膜和細胞外空間,ECS)。然後 ECS 可被用於準備用於分割的樣本。研究者沒有使用兩個神經元之間的接觸區域作為評估它們是否彼此連線的標準,而是選擇檢測與突觸連線(synaptic junctions)在一起的囊泡雲和線粒體。這些超微結構物件富集在突觸神經元的前後,因為它們是神經元之間資訊傳遞的重要因素。因此,如果檢測到囊泡雲和線粒體共同出現了,那就能很好地說明存在連線。從技術上看,研究者訓練了一個多類 CNN 來執行這一步驟。

需要指出,見諸報告的最佳結果與測試集大小之間存在依賴關係。這個多類 CNN 在小測試集上也得到了相當不錯的結果,可能是因為這種體量的連線數仍然可被處理。儘管實驗中的表現很不錯,但還不能肯定這樣的表現能否繼續在更大的資料集上維持,因為更大的資料集可能有更大的多樣性。

用CNN識別大腦神經元突觸連線

圖 3:與其它最佳方法的比較。圖中的 F1 分數反映了精度和召回之間的調和平均值。可以看到,SyConn 的表現優於其它方法。

基於之前檢測出的超微結構物件,SyConn 還能通過將這些物件的相對位置分配到神經突上來進一步細化重建結果。這個過程有助於亞細胞元件和神經元細胞型別的分類。在這篇文章中,研究者整合了一個隨機森林分類器(RFC)來分類樹突的各個部分:屬於棘突頭部、頸部還是樹突軸。增強後的細胞重建是細胞型別識別所必需的,而構建連線矩陣和後續的分析又會用到細胞型別識別。通過沿神經突比較線粒體和囊泡雲的體量,研究者發現有最高放電率的神經元型別有最高的密度。對神經元的超微結構物件和相關放電率的研究也許能讓我們瞭解它們在化學固定前在生物體內的生理學特性。

討論

連線組學近幾年發展迅速。密集的連線組分析受限於突觸的標記時間和後續的迴路分析步驟。SyConn 是一種能夠大幅降低分析時間的好方法,而且錯誤率很低,因為無需人工校對(誤差可接受)。對於資料集質量影響了 SyConn 的表現的情況,人工檢查將有益於準確度。根據這些結果,我們還可以看到通過使用預訓練的網路和後期訓練,深度 CNN 僅需要最少的訓練資料就能提取出超微結構資訊。

儘管自動化能顯著提升效率,但具有更大變化性和複雜性的自動神經突重建尚未被研究。目前,專家仍在生物資料分析中發揮著重要作用,但我們可以預見未來他們的作用將越來越小。相對而言,學會了所有這些規則的機器將可能接替這項工作。你認為這個領域的專家可被計算機完全替代嗎?

參考文獻

https://www.csuchico.edu/~pmccaffrey/syllabi/CMSD%20320/362unit4.html

http://www.sciencedirect.com/science/article/pii/S0968432814000250

http://www.sciencedirect.com/science/article/pii/S0959438811001887

相關文章