非侵入裝置貼在脖子上,就能代替人類發聲,研究登《自然通訊》

机器之心發表於2024-04-01
研究人員開發了一種由 AI 驅動的發聲貼片,可以非侵入性地粘附在喉部幫助發聲。

在你看不到的地方,說話這件小事對於許多人來說「難於登天」:2014 年美國一項針對發聲障礙的研究發現,近 1800 萬成年人在使用聲道說話時存在困難,而該群體中超過一半的人經歷過言語衰弱問題的時間超過 10 年。

現在,一種新型非侵入式可穿戴裝置成為了這一醫療需求新的解決方法。該技術包括粘附在脖子上的輕質貼片,該貼片可以測量人的頸部運動。接著,裝置處理器將這些訊號轉換為語音,然後播放語音音訊來代替人類發聲。
非侵入裝置貼在脖子上,就能代替人類發聲,研究登《自然通訊》
這項研究由來自加州大學洛杉磯分校(UCLA)生物醫學工程助理教授 Jun Chen 領導的研究小組完成。相關研究登上《自然通訊》。
圖片
論文地址:https://www.nature.com/articles/s41467-024-45915-7

該團隊創造了一種靈活的電磁響應可穿戴裝置,可以測量細微的頸部肌肉運動。然後,下游裝置(不是感測貼片)使用經過訓練的可識別一組短語詞典的機器學習演算法,將貼片感應到的肌肉運動解碼為語音。

這項技術可以造福那些受傷或患有聲帶麻痺疾病的人,以及那些做過喉切除術的人。

不過,該裝置可以播放的句子數量有限,目前的原型 AI 模型僅能從五個句子中做出選擇:嗨,你今天過得怎麼樣?;希望你的實驗進展順利!;聖誕節快樂!; 我愛你!; 我不相信你。此外,該模型根據沒有任何言語障礙的人的頸部運動進行了訓練和測試。

無聲的醫療技術

醫療裝置公司 Atos Medical 的臨床教育家 Barbara Messing 博士表示,「為患者提供更多選擇有助於提高他們的生活質量,這就是我們所有人都想要的。」

為了讓使用者聽得見聲音,該裝置將感應到的肌肉運動訊號傳遞給在外部處理器上執行的機器學習模型。該模型經過訓練,可以檢測與固定數量的預定義句子相對應的肌肉運動模式。當它檢測到這些短語之一時,處理器就會透過像揚聲器一樣的振動貼片來播放該句子。
圖片
研究人員開發了一種由人工智慧驅動的發聲貼片,可以非侵入性地粘附在喉部。然後,磁感應線圈和其中的柔性磁性材料就可以推斷皮膚下頸部和喉嚨的運動。

這個系統的喉部貼片應用了 Jun Chen 教授小組的關於新材料科學的研究成果,他們利用了材料當中一種稱為磁彈性的特性。在這種特性下,材料在被拉伸和壓縮時,其磁場強度會發生變化。日常活動和頸部運動會拉伸貼片,導致磁場發生變化,然後由內建的柔性感應線圈進行測量。這些材料協同工作,感知使用者頸部肌肉的微小 3D 運動。

新型磁彈性材料的靈活性使其能夠粘附並準確跟蹤使用者頸部肌肉的運動,這是先前已知的由磁彈性材料製成的類似感測器無法做到的。為了進一步提高其靈敏度,該小組將材料塑造成剪紙圖案(一種類似於摺紙的紙工藝,允許切割),使感測器在較小的拉伸和偏轉下表現均勻。

Jun Chen 教授表示,未來他們致力於將其研究成果轉化為醫療裝置,不斷的最佳化裝置並標準化批次生產的製造程式,改進軟體和硬體,增加翻譯詞彙量和準確性,讓裝置更加人性化。Jun Chen 教授估計,他們將在 3-5 年內生產出一種可行的醫療裝置。

原文連結:https://spectrum.ieee.org/assistive-tech-voice-patch

相關文章