機器學習演算法基於語言模式輔助診斷抑鬱症

周建丁發表於2016-07-13

原文:Machine Learning Algorithm Spots Depression in Speech Patterns
翻譯:KK4SBB
責編:周建丁(zhoujd@csdn.net)

南加州大學的研究人員近日開發了一款新的機器學習工具,它能夠檢測出某些語言相關的診斷標準,來評估患者的抑鬱症情況。這款工具名為SimSensei,它在醫生問診過程中監聽患者語言表達過程中的心理和神經性紊亂異常狀況,這些異常很難被問診者所察覺。當然,這款工具並不是要取代那些問診人員,而是在診斷過程中增加額外的客觀評判。

這個團隊的工作成果發表在IEEE Transactions on Affective Computing雜誌上。

抑鬱症的誤診斷是一類嚴重的健康問題,尤其是當主管醫生確診(或是誤診)了病情。2009年的一項調查覆蓋了大約50000位病人,大概只有一半的病人被正確地識別為抑鬱症患者,假陽性的數量遠遠超過了假陰性的數量,比例約為3:1。這個結果我們完全無法接受。

但這也是可以理解的。醫生,特別是全科醫生,很有可能因為兩種簡單而相關的因素過度診斷某種疾病:第一個原因,錯誤地確診某種疾病總是比沒有診斷出某種疾病更安全;第二個原因,消除任何單一診斷的可能性需要更豐富的專業知識和更大的把握。參見:濫用抗生素事件。

抑鬱症診斷所面臨的一個巨大問題就是它本身是一種異質性的疾病。抑鬱症有許多不同的病因,並且有很多表現形式。設想一個主管醫生每週要接診幾百位患者,他們的病情也五花八門,從一堆症狀明顯、一般問診就能確診的病例中發現精神疾病診斷的難度可想而知。這就存在了非常巨大的漏洞,正需要SimSensei之類的技術來填補。

SimSensei在語音中所跟蹤的抑鬱症相關特徵已經得到了文獻的支援。“之前的調查研究顯示,抑鬱症患者往往表現出平淡的或者負面情緒,說話的響度和音調變化減弱,話語減少了,語速也放緩,停頓增多,停頓時間也忽長忽短”,引自南加州大學發表的論文,“而且,抑鬱的語言聽上去顯得聲道和聲帶更緊張。”

這屬於典型的機器學習問題,即根據攜帶噪音的資料做出預測。通常所說的語音分析就是此領域的主要分支之一。

這裡所做的分析很簡單。只保留患者語音的母音發音部分,然後在頻域分析a、i、u母音的第一、第二個共振峰(頻譜峰值)。這個過程的前兩部分涉及了實際語音檢測器和一個相應的共振峰跟蹤。第三部分是演算法,是一個相對較老(1967年提出)的機器學習方法,就是k-means演算法。本質上,它的工作原理是通過收集資料集,並將它們按照均值或特定的類中心聚成多個類。

聚類的結果是一個三角形的空間或者圖,a,i,u的頻譜峰值分別位於三個角。這個三角形包含的區域代表一個母音空間,這是演算法得到的結果。然後,將此空間與一個“正常”的母音參照空間做比較,這個比例就作為抑鬱症(和創傷後應激障礙PTSD)的指標。

“我們評估了253位實驗物件的自動評估母音空間,證明了新的檢測手段檢測到抑鬱症和創傷後應激障礙患者的母音空間有顯著減小,”南加州大學的研究小組總結道,”我們證明了在測試部分互動或數量有限的語音資料時,新技術是健壯的,印證了該方法的實用性。最後,我們成功地顯示了該測試結果在不同個體和不同發音速率上的統計魯棒性。

抑鬱症患者與非抑鬱患者的母音空間比率並非差距懸殊,但這個差距也足以說明問題。該項研究的最重要的問題可能是抑鬱症/憂鬱症的初始分類,這是基於受試者的自我評估。此外,母音空間減少似乎並不侷限於抑鬱症和創傷後應激障礙,需要在諸如精神分裂症和帕金森氏病上進一步研究。


CCAI 2016中國人工智慧大會將於8月26-27日在京舉行,AAAI主席,多位院士,MIT、微軟、大疆、百度、滴滴專家領銜全球技術領袖和產業先鋒打造國內人工智慧前沿平臺,6+重磅大主題報告,4大專題論壇,1000+高質量參會嘉賓,探討人機互動、機器學習、模式識別及產業實戰。門票限時六折優惠中

圖片描述

相關文章