編輯 | 2049
想象一下,僅憑思維就能自如地操控電腦滑鼠,就像健全人使用手部一樣精準和流暢。這聽起來像科幻片中的場景,但在加州理工學院(MIT)的最新研究中,這樣的未來正在成為現實。
研究人員開發出了一種名為「FENet」的突破性技術,讓癱瘓患者能夠更精準地用意念控制電腦裝置。
該研究以「Enhanced control of a brain-computer interface by tetraplegic participants via neural-network-mediated feature extraction」為題,於 2024 年 12 月 6 日釋出在《Nature Biomedical Engineering》。
研究背景
腦機介面技術透過在大腦皮層植入電極陣列,讓人類思維可以直接控制計算機,為截癱患者重獲活動能力帶來希望。然而,當前的植入式腦機介面在精準度和可靠性方面還遠未達到健全人手部操控的水平。
其核心挑戰在於神經訊號的提取和解碼。這就像在嘈雜的音樂節現場要準確捕捉某個特定樂器的聲音,如何從充滿噪聲的神經活動中識別出有效的控制訊號。
隨著時間推移,植入電極周圍的組織變化會導致訊號質量逐漸下降,而傳統的訊號處理方法如閾值檢測(TCs)和小波變換(WTs)難以適應這種動態變化。這凸顯了開發更智慧、更穩健的特徵提取方法的必要性。
技術創新
該團隊提出的 FENet(Feature Extraction Network)框架透過深度學習方法實現了對這一技術瓶頸的突破。其核心創新在於構建了一個約束性端到端訓練架構,透過以下機制實現了特徵提取的最佳化:
統一引數對映
FENet 採用一維卷積神經網路架構,創新性地對所有電極採用相同的特徵提取引數。這一設計基於神經元活動的生物物理特性——動作電位波形主要取決於電極尖端與神經元的相對位置,而非神經元在行為中的具體功能。這種約束不僅降低了引數數量,提高了模型的泛化能力,更重要的是使得提取的特徵具有跨電極、跨腦區的一致性。
雙階段最佳化策略
系統採用創新的雙階段最佳化架構:第一階段將寬頻神經訊號轉換為神經特徵,第二階段建立特徵到行為的解碼對映。這種分離設計確保了特徵提取過程獨立於具體的行為解碼任務,提高了方法的通用性和穩定性。
自適應特徵學習
FENet 透過深度學習框架,能夠自適應地從原始訊號中學習最具資訊量的特徵模式,而不是依賴預設的特徵提取規則。這種資料驅動的方法顯著提升了對複雜神經訊號模式的捕獲能力。
圖 2:閉環訓練和管道以及BCI 系統的結構和效能。(來源:論文)
實驗驗證
研究團隊在三名截癱患者身上進行了實驗驗證:54 歲的 JJ(C5-C6),32 歲的 EGS(C5-C6)和 62 歲的 NS(C3-C4)。JJ 提供了 54 次會話資料,時間跨度從 2019 至 2022 年;EGS 提供了 175 次會話資料,時間跨度從 2014 至 2018 年;而 NS 完成了 9 次會話的手指網格任務測試。
在閉環控制任務中,FENet 相比現有方法顯著改善了多項指標:減少了瞬時角度誤差,提高了路徑效率,縮短了到達目標所需時間。
在8x8網格任務中,相比閾值檢測法(t = -11.850, P < 0.0001)和小波變換法(t = -4.252, P < 0.0001),FENet 在成功率和資訊傳輸率方面都取得顯著提升。每次測試中,參與者都表示強烈偏好使用基於 FENet 的解碼器。
研究還表明,FENet 展示了出色的泛化能力,可以在不同時期、不同腦區(如運動皮層和頂葉皮層)和不同受試者之間保持穩定效能。
雖然系統存在試驗間的變異性,但這種變異性主要源於行為因素對單電極水平神經活動的影響,可以透過多電極記錄和潛變數估計來緩解。這些發現為 FENet 在臨床中的實際應用提供了重要支援。
圖 3:JJ 的閉環效能評估。(來源:論文原圖 Figure 2)
總之,FENet 的突破不僅開創了腦機介面最佳化的新正規化,更讓「用思維控制裝置」的願景更近一步。這項將神經科學與深度學習相結合的創新,證明了跨學科方法能帶來顯著突破。
論文連結:https://www.nature.com/articles/s41551-024-01297-1