咳兩聲就能鎖定新冠!MIT收集20萬咳嗽樣本,用AI辨別無症狀感染者,準確率100%

大資料文摘發表於2020-11-05

咳兩聲就能鎖定新冠!MIT收集20萬咳嗽樣本,用AI辨別無症狀感染者,準確率100%

10月25日,喀什地區疏附縣24日發現1例新冠肺炎無症狀感染者後,新疆迅速對其密切接觸者、密切接觸者的接觸者進行核酸檢測,截至10月25日14時,檢測出137人呈陽性,經專家診斷,均為無症狀感染者

後疫情時代,無症狀感染者正成為疫情復發最大的威脅。沒有任何胸悶發熱症狀,你和同伴可能很難區分是否感染了新冠。

人工智慧可以,只要你給TA聽聽你的咳嗽聲

在最近發表在《IEEE醫學與生物學工程學雜誌》上的一篇論文中,麻省理工學院的研究人員表示,他們已經開發出可以識別COVID-19感染者咳嗽聲的AI

咳兩聲就能鎖定新冠!MIT收集20萬咳嗽樣本,用AI辨別無症狀感染者,準確率100%

論文地址:

https://www.embs.org/ojemb/articles/covid-19-artificial-intelligence-diagnosis-using-only-cough-recordings/

據論文顯示,研究小組開發了一種AI模型,該模型透過分析你的咳嗽錄音,可以將無症狀感染者與健康的人區分開來。所有人都可以透過網路瀏覽器以及手機和膝上型電腦等裝置自願提交的錄音。

研究人員稱,該模型由他們一直以來進行的“咳嗽檢測阿爾茲海默早期症狀”演變而來,疫情以來,研究者透過“網路眾籌”的方式,已經在全球蒐集了20多萬的咳嗽樣本,建立了有史以來最大的“咳嗽資料庫

透過這些咳嗽樣本和錄入的相關感染、性別、情緒資料,對該模型進行了聲音訓練。

目前,該模型識別出確診為Covid-19的人的咳嗽的準確率98.5%,其中,利用咳嗽聲識別無症狀感染者的準確度高達100%。 

麻省理工的研究小組正在努力將該模型整合到一個使用者友好的應用程式中,如果獲得FDA的批准並被大規模採用,該程式將有可能成為一種免費、便捷、無創的預篩查工具,以識別可能對Covid-19無症狀的人。

使用者可以每天登入,錄下咳嗽聲到他們的手機中,並立即獲得有關他們是否可能被感染的資訊。

麻省理工學院自動識別實驗室的研究科學家布萊恩·蘇比拉納(Brian Subirana)與麻省理工學院自動ID實驗室的Jordi Laguarta和Ferran Hueto聯合完成了這項研究。 

從阿茲海默症檢測到新冠檢測 

咳兩聲就能鎖定新冠!MIT收集20萬咳嗽樣本,用AI辨別無症狀感染者,準確率100%

其實這項演算法並非為新冠定製。

早在疫情爆發之前,這個研究小組已經在咳嗽的手機錄音中訓練演算法,以準確診斷肺炎和哮喘等疾病。麻省理工學院的團隊正在以類似的方式開發AI模型,以分析強迫咳嗽記錄,以檢視它們是否可以檢測出阿爾茨海默氏症的體徵,這種疾病不僅與記憶力下降有關,而且還與神經肌肉退化(如聲帶減弱)有關。 

他們首先訓練了一種通用的機器學習演算法或稱為ResNet50神經網路,以區分與不同聲帶強度相關的聲音。研究表明,聲音“ mmmm”的質量可以表明一個人的聲帶有多弱。Subirana在包含了1000多個小時語音的有聲讀物資料集上訓練了神經網路,以從“ the”和“ then”等其他詞中挑選出“ them”一詞。 

該小組訓練了第二個神經網路來區分言語中明顯的情緒狀態,因為已證明阿爾茨海默氏症患者以及神經系統較弱的人表現出某些情緒,例如沮喪或平淡無奇,比他們表達快樂還是冷靜的情緒更高。

研究人員透過在大型演員資料集上訓練情緒情感分類器(例如中性,平靜,快樂和悲傷)來開發情緒語音分類器模型。 

然後,研究人員在咳嗽資料庫上訓練了第三個神經網路以辨別肺和呼吸功能的變化。 

最後,該團隊將這三個模型結合在一起,併疊加了一種演算法來檢測肌肉退化。該演算法透過實質上模擬音訊蒙版或噪聲層,並區分強咳嗽(透過噪聲可以聽到的咳嗽)與較弱的咳嗽,來做到這一點。

透過新的AI框架,該團隊提供了包括阿爾茨海默氏症患者在內的音訊記錄,發現與現有模型相比,它可以更好地識別阿爾茨海默氏症的樣本。

結果表明,聲帶強度、情緒、肺和呼吸功能以及肌肉退化是診斷該疾病的有效生物標誌物。 

當冠狀病毒大流行開始蔓延時,Subirana想知道他們針對阿爾茨海默氏症的AI框架是否也可以用於診斷Covid-19,因為越來越多的證據表明感染的患者會經歷一些類似的神經系統症狀,例如暫時性神經肌肉損傷。 

“說話和咳嗽的聲音都受到聲帶和周圍器官的影響。這意味著當講話時,部分講話就像是咳嗽,反之亦然。這也意味著我們很容易從流利的言語中衍生出一些東西,人工智慧可以簡單地從咳嗽中發現一些資訊,包括人的性別、母語甚至情緒狀態。實際上,您的咳嗽中蘊含著情感。” Subirana說。

“所以我們認為,為什麼我們不嘗試探究這些阿茲海默症的生物標誌物(以及看它們是否與Covid相關)”。 

20萬+咳嗽樣本,已知最大的咳嗽研究資料集 

咳兩聲就能鎖定新冠!MIT收集20萬咳嗽樣本,用AI辨別無症狀感染者,準確率100%

在4月,研究小組著手收集儘可能多的咳嗽記錄,包括來自Covid-19患者的咳嗽記錄。

他們建立了一個網站,人們可以透過手機或其他支援網路的裝置記錄一系列咳嗽。參與者還填寫了他們正在經歷的症狀的調查表,無論他們是否患有Covid-19,是否透過官方測試,透過醫生對其症狀的評估或是否經過自我診斷而得到了診斷。他們還可以記錄自己的性別,地理位置和母語。 

迄今為止,研究人員已經收集了70,000多條錄音,每條錄音包含多個咳嗽聲,總計約200,000咳嗽音訊樣本,Subirana說這是“已知最大的咳嗽研究資料集”。確認患有Covid-19的人(包括無症狀的人)提交了大約2500份錄音。

該團隊使用了2,500個與Covid相關的記錄,以及他們從集合中隨機選擇的另外2500個記錄來平衡資料集。他們使用了4,000個樣本來訓練AI模型。然後將其餘的1,000個記錄輸入模型中,以檢視它能否準確區分出Covid患者和健康個體的咳嗽。 

令人驚訝的是,正如研究人員在論文中所寫的那樣,他們的努力揭示了“阿爾茨海默氏症和新冠咳嗽演算法之間驚人的相似之處”。 

他們發現,在原本用於阿爾茨海默氏症的AI框架內無需進行大量調整,他們就能找到針對Covid-19的四種生物標誌物的模式-聲帶強度、情緒、肺和呼吸功能以及肌肉退化。該模型從Covid-19確診的人中識別出98.5%的咳嗽,並準確地檢測到了所有無症狀的咳嗽。 

Subirana說:“我們認為這表明,即使您沒有症狀,當您擁有Covid時,您產生聲音的方式也會改變。” 

100%檢測到無症狀感染者 

Subirana強調,這種AI模型的優勢不在於檢測有症狀的新冠患者,不管他們的症狀是由於Covid-19還是其他症狀(如流感或哮喘)引起的。該工具的優勢在於它能夠分辨無症狀新冠感染者的咳嗽和健康的咳嗽。  

MIT的團隊正在與一家公司合作,根據他們的AI模型開發免費的預檢應用程式。他們還與世界各地的多家醫院合作,收集更大,更多樣化的咳嗽記錄集,這將有助於訓練和增強模型的準確性。

正如他們在論文中提出的那樣,“如果預篩查工具始終在後臺並且不斷改進,那麼氾濫症就可能成為過去。” 

最終,他們設想可以將他們開發的音訊AI模型整合到智慧揚聲器和其他聽音裝置中,以便人們可以方便地(也許每天)對他們的疾病風險進行初步評估。

相關連結:

https://news.mit.edu/2020/covid-19-cough-cellphone-detection-1029

https://techcrunch.com/2020/10/30/cough-scrutinizing-ai-shows-major-promise-as-an-early-warning-system-for-covid-19/

https://www.engadget.com/ai-covid-19-cough-detection-from-recordings-213858299.html

相關文章