準確率97%,將大腦訊號轉化為語音,新型腦機介面讓失語者「說話」

ScienceAI發表於2024-08-16

圖片

編輯 | 蘿蔔皮

肌萎縮性脊髓側索硬化症又稱漸凍人症(ALS),會影響控制全身運動的神經細胞。這種疾病會導致患者逐漸喪失站立、行走和使用雙手的能力。它還會導致患者失去對說話肌肉的控制,從而無法進行語言表達。

加州大學戴維斯分校的研究團隊開發了一項新技術旨在幫助因癱瘓或 ALS 等神經系統疾病而無法說話的人恢復交流能力。它可以解讀使用者說話時的腦訊號,並將其轉換成計算機大聲朗讀的文字。其準確率高達 97%,是同類系統中最準確的。

該團隊的研究人員在一名因 ALS 而導致語言能力嚴重受損的男子的大腦中植入了感測器。這名男子在啟動該系統後幾分鐘內就能傳達自己想要說的話。

這項研究的主要負責人之一,加州大學戴維斯分校的 David Brandman 表示:「我們的 BCI 技術幫助一名癱瘓男子與朋友、家人和護理人員進行交流。我們的論文展示了迄今為止最準確的語音神經假體(裝置)。」

該研究以「An Accurate and Rapidly Calibrating Speech Neuroprosthesis」為題,於 2024 年 8 月 14 日釋出在《The New England Journal of Medicine》。

圖片

腦機介面(BCI)可將癱瘓患者試圖說話時產生的皮層活動轉化為計算機螢幕上的文字,從而幫助癱瘓患者進行交流。腦機介面的交流一直受到大量訓練要求和準確性限制的限制。

加州大學戴維斯分校的研究團隊開發了新型 BCI 裝置,能將大腦訊號轉化為語音。

為了開發該系統,研究小組讓患有漸凍人症的 45 歲男子 Casey Harrell 參與了 BrainGate 臨床試驗。入組時,Harrell 手腳無力(四肢癱瘓)。他所能表達的語言非常難懂(存在構音障礙) ,需要特別熟悉他的人幫他翻譯。

2023 年 7 月,Brandman 給病人植入了研究性 BCI 裝置。他將四個微電極陣列植入左側前腦回,這是一個負責協調語言的大腦區域。這些陣列旨在記錄來自 256 個皮層電極的大腦活動。

圖片

圖示:電極位置和語音解碼設定。(來源:論文)

「我們實際上是在檢測它們試圖活動肌肉和說話的情況。」同樣參與這項研究的神經外科系助理教授 Sergey Stavisky 解釋說,「我們正在記錄大腦試圖向肌肉傳送這些指令的部分。我們基本上是在監聽,然後將這些大腦活動模式轉化為音素——就像音節或語言單位——然後再轉化為他們想說的話。」

更快的培訓,更好的效果

雖然最近 BCI 技術不斷進步,但實現交流的工作進展緩慢,而且容易出錯。這是因為解釋大腦訊號的機器學習程式需要大量時間和資料才能完成。

「以前的語音 BCI 系統經常出現單詞錯誤。這使得使用者難以被持續理解,成為溝通的障礙。」Brandman 解釋道,「我們的目標是開發一種系統,讓人們在想說話的時候都能被理解。」

Harrell 在提示和自發對話環境中都使用了該系統。在這兩種情況下,語音解碼都是實時進行的,並透過持續的系統更新來保持準確工作。

解碼後的文字顯示在螢幕上。令人驚奇的是,這些單詞是用 Harrell 患 ALS 之前的聲音朗讀出來的。這些聲音是用 Harrell 患漸凍人症前的聲音樣本透過訓練軟體合成的。

準確率97%,將大腦訊號轉化為語音,新型腦機介面讓失語者「說話」

影片:新型 BCI 技術相關介紹。(來源:網路)

影片連結:https://mp.weixin.qq.com/s/FFqhcGa4YHJfXH0p7rtaZQ

在第一次語音資料訓練中,該系統用了 30 分鐘就達到了 99.6% 的單詞準確率,此時詞彙量為 50 個。

「我們第一次試用該系統時,他高興得哭了,因為螢幕上出現了他想說的正確單詞。我們都哭了。」Stavisky 說。

在第二次訓練中,潛在詞彙量增加到了 125000 個單詞。只需增加 1.4 小時的訓練資料,BCI 就能在詞彙量大幅增加的情況下達到 90.2% 的單詞準確率。

透過進一步的訓練資料,BCI 在手術植入後的 8.4 個月內維持了 97.5% 的準確率,Harrell 使用它以每分鐘大約 32 個字的速度進行自定節奏的對話,累計時間超過 248 小時。

圖片

圖示:語音解碼效能。(來源:論文)

對 ALS 患者交流的變革性影響

「目前,我們可以在大約 97% 的情況下正確解碼Harrell想要說的話,這比許多試圖解讀人的聲音的市售智慧手機應用軟體都要好。」Brandman 說,「這項技術具有變革性,因為它為那些想說話卻無法說話的人帶來了希望。我希望像這種語音 BCI 這樣的技術能夠幫助未來的病人,使他們能夠與家人、朋友流暢地交談。」

圖片

圖示:對話模式使用者介面。(來源:論文)

「無法溝通是一件非常令人沮喪和打擊士氣的事情。就好像你被困住了一樣。」Harrell 說,「像這樣的技術將幫助人們重返生活和社會」。

論文的第一作者 Nicholas S. Card 說:「看到 Harrell 透過這項技術恢復了與家人和朋友交談的能力,我們感到無比欣慰。」

「Harrell 和其他 BrainGate 參與者確實非同凡響。他們參加這些早期臨床試驗值得我們給予高度讚揚。他們這樣做並不是希望獲得任何個人利益,而是為了幫助我們開發一種系統,讓其他癱瘓患者恢復交流和行動能力。」BrainGate 試驗發起人兼研究員 Leigh Hochberg 說。

論文連結:https://www.nejm.org/doi/full/10.1056/NEJMoa2314132

相關內容:
https://www.cnbeta.com.tw/articles/science/1442257.htm
https://www.nytimes.com/2024/08/14/health/als-ai-brain-implants.html
https://www.brown.edu/news/2024-08-14/bci-speak-again
https://www.ucdavis.edu/news/brain-computer-interface-allows-man-als-speak

相關文章