麻省理工學院的科學家正打造一個可根據生理訊息、語音對話辨別人們情緒的人工智慧系統,它可透過穿戴裝置蒐集大量生理、語音資料,提高辨識人類情緒的精準度。

麻省理工學院(MIT)的科學家們正在打造一個可根據人們談話所使用的字彙及語氣來預測對方情緒的行動程式,此一基於人工智慧(AI)技術的程式主要被應用在穿戴裝置上,將可望促進人們的交流。

該論文是由電腦科學暨人工智慧實驗室(Computer Science and Artificial Intelligence Lab,CSAIL)與醫學工程暨科學學院(Institute of Medical Engineering and Science,IMES)連手進行,贊助單位為三星的策略與創新中心(Samsung Strategy and Innovation Center),準備在下週舉行的美國人工智慧協會(Association for the Advancement of Artificial Intelligence,AAAI)年度會議上發表。

作者之一的Tuka Alhanai表示,想象在雙方的對話結束後,還能回放並觀察對方感到最焦慮的時刻,現在的成果已經離實際應用不遠,不久的將來,人們的口袋裡就會有一個具備人工智慧的社交教練。

科學家們所建置的系統能夠分析聲音、文字與生理上的訊號,來判斷談話過程的氣氛,準確率已高達83%。 藉由深度學習技術,系統還能對談話過程每5秒提供情緒分數。

另一名作者Mohammad Ghassemi(上方主圖左)則說,這是第一個同時蒐集談話與生理資料而進行的實驗,就算聊天的話題是中立的,或者是缺乏結構的,也都能實時分辨談話時的情緒波動。

初期的實驗物件是戴著三星的Simband,這是一個可偵測及紀錄心率、血壓、移動與皮膚溫度的穿戴手環,該系統同時也能捕捉聊天時的語音資料來分析說話時所使用的詞彙、語調及能量。 科學家們仍在持續改善該系統,邀請更多的使用者在諸如Apple Watch等智慧型手錶上安裝程式,並在聊天時啟用它,以蒐集更多的資料並強化其演算法。

透過人工智慧所分析的情緒結果與人們平常的觀察頗為一致,例如單調的口氣或是暫停太久時,通常是悲傷的表示,若是精力充沛並使用不同的語句則代表快樂的情緒,若是身體出現煩燥現象或心率加速也是悲傷所造成。

Alhanai說,目前的演算還不夠可靠,下一步將會改善演算法的情緒粒度,讓它能夠分辨更細微的情緒,包括無聊、緊張或興奮等,而不只是大範圍的正面或負面情緒。