僅次於癌症將成人類第二大殺手,面對抑鬱症AI能做些什麼?

THU数据派發表於2020-11-04

近幾年,關於抑鬱症自殺的社會新聞層出不窮,讓這個在過去一直被大眾忽視的疾病逐漸浮出水面。上個月,話題#抑鬱症成僅次於癌症的人類第二大殺手#登上微博熱搜,大眾終於對患抑鬱症群體有了較直觀的認識:抑鬱症屬於情感性精神障礙疾病,常伴隨焦慮發生。臨床體現為“三低”——情緒低落,興趣減退,動力不足,且持續至少2周以上。抑鬱還可能增加某些健康問題的風險,如心臟病。據世衛組織預測,到2020年,抑鬱症將代替癌症成為世界第二大疾病,大約有8%的男性和15%的女性在他們的一生中會患上抑鬱障礙, 嚴重影響生活質量, 並且其中有近 15%的人選擇了自殺。此外,還有相當多的患者根本沒有意識到自己患有抑鬱症,更沒有進行過診治。因此, 對抑鬱症患者進行早期識別診斷, 並及時給予治療十分重要。近幾年,人工智慧變得越來越“聰明”,並開始在醫療領域取得一些成果。那麼,人工智慧技術能夠在治療抑鬱症方面發揮什麼作用嗎?

僅次於癌症將成人類第二大殺手,面對抑鬱症AI能做些什麼?

一、發病預測

人工智慧技術針對抑鬱症的發病預測,目前主要是使用不同的機器學習方法,對可以反映抑鬱症傾向的因子及各種疾病標誌物來做出判斷。目前, 應用於抑鬱症的機器學習演算法主要為傳統機器學習, 如支援向量機隨機森林、K-近鄰演算法、淺層人工神經網路等。但近年來隨著深度學習的發展, 卷積神經網路自動編碼器、深度置信網路等開始逐漸被應用於抑鬱症研究中。利用機器學習建立抑鬱症預測模型的基本原理為採集抑鬱症風險因素、生物標記物等資料, 然後對這些資料進行預處理得到歸一化的資料集, 按一定比例分為訓練集和測試集, 利用訓練集對機器學習演算法進行訓練, 最後用測試集對模型進行效能評估, 並在驗證評估過程中對模型進行不斷最佳化。

機器學習的優勢在於對資料中潛在規律的挖掘。因此, 建立預測模型的第一步是收集資料。目前,研究的資料主要有年齡、性別、藥物濫用等社會人口學資料, 臨床收集的軀體症狀、心理狀態資料,醫學儀器採集的腦電訊號(Electroencephalography, EEG)、腦部核磁共振成像(Magnetic Resonance Imaging, MRI)、眼動資料、心率變異性引數等生理訊號資料。其中基於腦電訊號和腦部核磁共振成像的應用最為廣泛, 但是由於MRI等生理訊號的採整合本較高, 故研究者們逐漸探索採整合本低卻能很好預測抑鬱症的資料,比如語音、表情等。

另外,隨著科技的進步,採集資料的方式也變得越來越多元化。除了MRI等生理訊號的採集,還有包括基於問卷收集調查資料, 透過各類感測器採集健康資料, 從網路平臺上獲得公開資料等。隨著近年來物聯網技術的發展,使得各種可穿戴裝置承載大量的健康資訊, 很多研究者將這些資料透過機器學習應用於抑鬱症領域,包括應用智慧手機感測器APP來獲取日活動度、睡眠情況、社會交流情況等資料來預測個體的抑鬱情況。另外,移動網際網路的普及讓大量使用者透過 Facebook、Twitter 等社交網路平臺進行情感表達、日常溝通, 這些資料同樣為研究者透過將自然語言處理技術、情感分析與機器學習結合來對使用者的心理健康、情感障礙進行研究提供了機會。

例如2014年,中國科學院心理所計算網路心理實驗室負責人朱廷劭發起了心理地圖PsyMap專案。PsyMap透過網路爬蟲整合微博樹洞留言資訊後,再透過AI對留言進行分析篩查,最後,再由志願者對有自殺意向的人進行心理危機干預,試圖在他們走向終結之前挽救生命。從2017年正式上線至2019年10月,心理地圖PsyMap共計給4222人傳送了干預私信;2018年,由荷蘭阿姆斯特丹自由大學人工智慧系教授黃智生開啟了“樹洞計劃”。樹洞計劃尋找瀕臨危險的抑鬱症患者的邏輯跟心理地圖相差不大,都是利用AI進行篩查、分級,而後介入。但樹洞計劃的自殺危險程度分級更為明確,十級為最高階,即自殺正在開始;九級則是有明確的自殺計劃。隨後幾級以悲觀厭世的程度依次遞減,在6級以下,志願者一般不會直接介入。黃智生表示,運用知識圖譜技術,AI機器人可透過監控留言分析一個人的情緒。幾乎每個月,救援團都能救回50條生命,一年時間裡,救援團阻止了約800次自殺。

不需要挖掘社交平臺上的資料,而是藉助了計算機視覺機器學習的方法也能用來預測抑鬱症指標。2017年,由哈佛大學和佛蒙特大學共同主導的一個專案以166位 Instagram 使用者為研究樣本,共分析了他們分享在平臺上的43,950張照片,其中71張涉及患有抑鬱症病史。據研究人員發表在EPJ Data Science上的論文顯示,他們使用了機器學習工具成功識別出抑鬱症的標誌,並使用顏色分析、後設資料元件和麵部檢測演算法,從43,950張Instagram 照片中計算提取統計特徵,而每張照片的色調、亮度以及使用的濾鏡都是其重要的分析維度。研究結果表明,患有抑鬱傾向的使用者更傾向於釋出更多照片,且顏色多為藍色、灰色和深色;其次,他們使用的濾鏡也更少;另外,患有抑鬱傾向的使用者也更喜歡釋出人臉特寫照片,但與健康的使用者相比,其分享的每張照片出現的人臉數量更少。這可能表明,抑鬱症患者更喜歡在小範圍的社交環境中和人交往。同時,研究結果還表明,在利用機器學習分析了這些照片得到的模型之後,所得模型的表現優於普通醫師診斷抑鬱症的平均成功率。

除了採集語音、文字、影像等資料進行研究,機器學習與神經影像結合也取得了一定進展。一項研究將ML與MRI相結合預測抑鬱症的發作,透過採集33名10~15歲少女各腦區的灰質、皮質厚度資料,採用支援向量機技術預測5年內抑鬱症發作機率,總體準確率達到70%(敏感性69%,特異性70%。而韓國有研究者使用隨機森林模型發現,家庭關係、社會關係和家庭收入的滿意度對於構建抑鬱症發病風險的預測模型很重要,說明使用調查資料預測抑鬱症的未來發作有潛力。

總之,針對抑鬱症的發病預測,目前主要是使用不同的ML方法對生理、行為資料進行分析。當前,此類研究還處於嘗試階段,未正式投入臨床應用,但已顯示出巨大潛力,未來可為抑鬱症的一級預防提供支援。

二、早期識別

早期的抑鬱症狀很容易與單純的情緒低落相混淆,不易被察覺,導致患者錯失治療的最佳時機。現階段研究主要方向是將ML方法與腦電、語音資訊、手機使用行為、可穿戴裝置採集的資訊以及文字自動分析技術相結合,對抑鬱症人群進行早期識別。

例如2016年,南加州大學的研究人員開發了一款機器學習工具,它能夠檢測出某些語言相關的診斷標準,來評估患者的抑鬱症情況。這款工具名為SimSensei,它在醫生問診過程中監聽患者語言表達過程中的心理和神經性紊亂異常狀況,這些異常很難被問診者所察覺。研究者表示:“我們評估了253位實驗物件的自動評估母音空間,證明了新的檢測手段檢測到抑鬱症和創傷後應激障礙患者的母音空間有顯著減小。我們證明了在測試部分互動或數量有限的語音資料時,新技術是健壯的,印證了該方法的實用性。最後,我們成功地顯示了該測試結果在不同個體和不同發音速率上的統計魯棒性。”

2017年,來自 IBM 的計算精神病學和神經成像研究小組團隊開始嘗試利用機器學習預測人患精神疾病的風險。該專案以 2015 年發表的研究作為基礎,透過對 59 名普通人的語言方式追蹤、分析,並對語言連貫性進行評分,確定潛在患病風險。59 位參與者在隨後兩年中,有 19 名出現了精神障礙,而 AI 預測的精確度達到 83%,這背後的判斷依據,是 AI 技術發現處於精神疾病風險的人在說話時使用了較少的所有格代詞,並且連貫句子較少,這可能是精神疾病的一部分前兆。不過,關於對於語言的分析是否能夠適用於所有語種,以及不同病症是否會有不同的語言傾向,有待進一步研究。

2018年,史丹佛大學人工智慧實驗室與視覺實驗室負責人李飛飛帶領團隊公佈一種基於機器學習的抑鬱症症狀嚴重程度測量方法,該方法使用了影片、音訊和文字資料集,以及因果卷積神經網路模型,透過表情和語音診斷一個人是否患了抑鬱症,準確率超過80%。不僅如此,該模型還能部署到手機上,從而讓更多的人能夠進行診斷。值得一提的是,這項研究成果還入選了NIPS NeurIPS 2018醫療健康機器學習(ML4H)Workshop。

在抑鬱症群體中,兒童是一個比較特殊的存在。據統計,大多數自閉症兒童的父母都是在孩子出生後1到3年才發現孩子的變化,在美國,這個年齡中位數為4.3歲。但是,大量研究表明,在綜合徵完全顯現之前,進行早期干預可以降低ASD的嚴重程度,並改善兒童的大腦和行為發育。有沒有一種方法可以縮短兒童出現症狀到確診中間的時間差呢?

2020年,一家位於加利福尼亞的公司推出一種新的自閉症譜系障礙(ASD)診斷工具Cognoa,它能在出現相關跡象的幾周內做出ASD診斷,遠快於當前的標準。Cognoa的技術來自史丹佛大學醫學院兒科學副教授Dennis Wall實驗室,依據於父母調查,家庭錄影和臨床醫生問卷等資料。研究者表示,該工具的演算法是根據來自數百個不同性別、種族和種族背景的實際案例的資料進行訓練的,它不僅可以加快診斷時間,而且可以消除當前系統固有的許多偏差。

最近,該公司在美國各地的14個地點完成了一項關鍵的雙盲臨床試驗。目前, 關鍵試驗的結果尚未公佈, 但該公司表示,此試驗“已超過了FDA同意的目標基準”,在性別和種族上都是準確的。另外,這項研究於2019年7月至2020年5月進行,在今年春季新換大流行期間透過遠端醫療對部分兒童進行了遠端評估。在遠端管理上,該工具的效能也一樣好。 公司計劃在未來幾個月內提交完整的研究報告以供發表,不久將正式提交FDA。如果獲批成功,Cognoa將成為首個自閉症譜系障礙診斷工具。

目前,AI在抑鬱症的早期識別方面取得了可觀進展,可以降低人群中抑鬱症早期篩查的假陰性率,為疾病早期診斷治療提供更多可能。但同時也存在一定的誤診率,需要臨床醫師進一步診斷,因此不可完全依賴於AI的分析結果,需視應用場景而定。

僅次於癌症將成人類第二大殺手,面對抑鬱症AI能做些什麼?

三、輔助診斷

目前抑鬱症的診斷是以精神科醫師的精神檢查為主,這雖然無法用技術替代,但為了實現更加客觀、高效的診斷,AI技術逐步應用於對抑鬱症患者的輔助診斷。其中,ML與MRI技術的結合,可以輔助診斷抑鬱症,同時也可以反映抑鬱症的嚴重程度。基於體素-相關向量機模型的診斷準確率為85%,敏感性為84%,特異性為85%,基於體素-特徵形態-相關向量機模型的診斷準確率為90%,敏感性為93%,特異性為87%,後者雖提高了總體預測準確性,但提升幅度未超過5%。

國內也有研究者利用不同的ML方法,對腦電圖、眼動追蹤資訊、皮膚電資料進行分析,準確度均在65%以上。將這3種模式組合用作分類器的輸入,發現透過logistic演算法獲得的準確度最高為79.6%,在整體上提高了診斷準確性。例如,望里科技的AI抑鬱評測系統利用腦電、眼動、皮電等資訊採集的生理資料,對抑鬱症進行客觀的評估。透過複雜的資料運算,該系統可以尋找將抑鬱症患者與健康人群進行有效區分的計算機模型。透過與北京大學第六醫院的科研合作,目前望里科技的抑鬱輔助診斷評估分類準確率已達到81%。據悉,未來該系統將擴充到自閉症、精神分裂、老年痴呆、暴力傾向等問題的研究和產品開發。並且,望里科技還在上述系統的基礎上開發了自殺風險評估系統,這一產品被運用於服刑人員的心理管理,幫助獄警瞭解並管理服刑人員心理健康狀況,達到預防服刑人員自殺的目的。該產品在教育、醫療領域也有應用的潛力。

AI技術也可以用於量表開發,促進情感障礙的高效鑑別診斷。通常,雙相情感障礙與抑鬱症難以鑑別,有研究者利用機器學習的RF模型來最佳化情感障礙評估量表,進而開發出更為簡潔的中文雙相情感障礙診斷清單,並將其應用於臨床實踐,便於對雙相情感障礙和抑鬱症進行快速有效的鑑別診斷。

四、治療

1、療效預測

事實上,機器學習在抑鬱症診療中最突出、普遍的應用之一,就是其在藥物治療結果上的使用。因為抑鬱症的發病機制目前仍不清楚,在過去50年抑鬱症的藥物治療中,大約有 70%的病人是症狀改善,還有30%的抑鬱症病人是藥物不起作用。如果檢索在抑鬱症診療中應用機器學習的期刊就會發現,大部分的論文都將重點放在了精神藥物治療上。 

其中一項著名的研究利用機器學習對相關症狀進行聚類,隨後建立了一個機器學習模型來評估幾種主要抗抑鬱藥物的療效。結果發現了三組症狀,並發現研究涉及的幾種抗抑鬱藥的療效存在統計學上的顯著差異。這表明醫生在給抑鬱症患者開藥時,應該根據患者所表現的具體症狀對症下藥。 

除了對藥物療效進行預測,也可以透過ML方法對物理治療的療效進行有效預測。 

2、心理治療

當前,對於抑鬱症的常規治療方式是以心理治療為主,藥物治療為輔。而利用人工智慧技術對患者進行心理治療,則是透過構建虛擬場景、虛擬人物,結合心理治療師對抑鬱症患者進行認知行為治療、人際心理治

僅次於癌症將成人類第二大殺手,面對抑鬱症AI能做些什麼?

接受治療的患者和VR環境的影像

2016年,英國倫敦大學學院等機構研究人員與西班牙同行開展一項研究,讓15名年齡在23歲至61歲間的抑鬱症患者配戴虛擬現實頭盔,並透過與虛擬現實場景中的虛擬人物互動開展相關治療。研究人員表示,虛擬現實頭盔能讓患者“代入”一個虛擬化身,在虛擬環境中與其中人物進行互動。試驗中,研究人員讓患者化身與一個情緒低落的虛擬小孩交流,學會如何向小孩表達同情心。在程式設定下,這個小孩會對患者化身的講話產生積極反應,逐漸停止哭泣。然後研究人員讓患者反過來“代入”到小孩身上,從小孩的視角來觀察整個交流過程。每名患者接受3次這樣的虛擬現實治療。結果顯示,完成療程的一個月後,有9名患者的症狀出現緩解跡象,其中4人的抑鬱症嚴重程度下降十分明顯。

藉助虛擬現實技術開展心理治療時,還可利用ML演算法開發心理智慧聊天機器人。例如2019年,Flow宣佈推出其聊天機器人治療師來治療抑鬱症。該款名為Flow的聊天機器人治療師,每天與使用者進行對話,並提供自助技術、情緒跟蹤、精選影片、冥想和心理鍛鍊。它幫助使用者瞭解為什麼睡眠、鍛鍊、營養和冥想是抑鬱症康復的主要支柱,並收集情緒資料以行為療法為模型,提供個性化的反應。

隨著5G的普及,相信虛擬現實技術能夠突破硬體條件的限制,在治療抑鬱症方面有更多應用能夠落地。儘管這種方式不能取代心理治療師的角色,但仍提供了一種經濟高效的治療方案,同時也可以作為心理治療的輔助工具在臨床應用。

五、人工智慧技術在抑鬱症應用中存在的問題

目前,以抑鬱症為代表的精神類疾病大多病因未明,遺傳因素、社會心理因素、素質因素都可能與發病有關。業內有一句經典的比喻:現在人類對大腦的認知水平就好比在黑夜的足球場角落點了一支蠟燭。這形象地說明了當下人類認知的困境,而依賴人類輸入知識進行判斷的人工智慧自然也受此影響。除此之外,在研究過程中還面臨以下問題:

1、樣本代表性較差

目前大部分基於人工智慧對抑鬱症診療的研究普遍樣本量較小,不能很好地反映總體抑鬱症人群的特徵。如何實現智慧手段對疾病的預測、鑑別、診斷、治療,需要足夠的樣本資料充分覆蓋每個群體的特徵進行計算,避免出現由於抽樣誤差導致的資料偏倚。

2、智慧裝置相關的倫理問題

智慧手機為代表的移動裝置雖然為患者帶來了諸多好處,但對加強隱私保密措施的研究仍然有限。儘管患者的資訊通常是匿名的,但資料重新識別技術仍然對個人資訊構成潛在威脅。由於抑鬱症患者的特殊性,臨床資訊的洩漏可能會導致情緒創傷、惡化病情。因此,未來的政策應著重於隱私問題的解決,在資料的有益利用與個人隱私之間取得平衡。 

3、臨床應用面臨的困難

因臨床資料越來越複雜,研究人員必須處理不同型別、不同來源的大資料,如人口資料、影像資料、遺傳資訊資料、社交網路資料等。臨床資料的多樣性增加了設計演算法和建立推理模型時的複雜程度和困難程度,因此大多數研究僅停留在模型建立等理論基礎上,還未將大資料分析的成果轉化為臨床應用。 

而至於AI+精神健康商業化發展,更是有很長的路要走,尤其是目前企業探索的部分診療方式正飽受質疑。其中,透過情緒識別來監控情緒並判別心理狀態這一做法所受到的質疑最大。因為在高速運轉的社會中,飽經規訓的人們並不會把情緒明晃晃地寫在臉上。為探討情緒識別演算法與真實情感的相關度,美國心理科學協會曾委託五位來自該領域的傑出科學家進行了資料收集和科學證明。最終,五位科學家給出的論文顯示,情緒的表達方式多種多樣,很難從一組簡單的面部運動中可靠地推斷出一個人的感受,表情與心情之間沒有堅實的科學依據證明有直接關聯。這也是為什麼微軟、谷歌、IBM、亞馬遜等公司尚未將情緒識別演算法投入診療市場的原因之一。 

另外,患者的接受度也對人工智慧的應用提出了考驗。無論是心理諮詢還是精神科問診,都要求患者主觀上對諮詢師/醫生充分信任,積極配合治療。但目前,人類對AI的心理檢測接受度普遍不高,這是由於心理檢測中涉及很多主觀判斷,如焦慮、心境低落等等。人類醫師具備共情能力,更易被患者認為“聽懂了我的話”,而人工智慧則易被視為“冷冰冰的機器”,難以獲得信任。 

所以,很多從業者認為,儘管AI對於抑鬱症的診療研究,已在影像、智慧穿戴、文字識別等方面有了突破,但它應該是最後的防線,而不應該是前線。真正能讓抑鬱症患者從陰霾中走出來的不是科技,而是有觸感的關懷。而對於患者而言,自己的努力也非常重要,畢竟就像魯迅所說,“人類的悲歡很多並不相通”,再專業的救助也很難做到完全將心比心,最終還是需要靠自己走出來。

相關文章