在人們的認知中,機器與人的分界線是機器是否具有情感。舉個例子,如果一對情侶吵架,而有一方顯得過於冷漠,那麼另一方很有可能向對方說出類似於「你是一個沒有情感的機器」的話。因此,機器是否具有情感是機器人性化程度高低的關鍵因素之一。
早在 1997 年,MIT 媒體實驗室就提出了情感計算(Affective Computing)的概念,情感計算旨在通過賦予計算機識別、理解和表達人的情感的能力,使得計算機具有更高的智慧。
情感智慧是讓機器更加智慧的關鍵,具有情感的機器不僅更通用,更強大,更有效,而且與人類的價值觀相一致。人類的情感機制也使我們能夠完成太難程式設計或難以讓當前機器學習的任務 [1]。
例如,我們的恐懼情緒使我們能夠意識到危險並保持安全。我們感知他人的情感並站在對方的角度思考問題使我們在複雜的世界中可以做出恰當的決策。飢餓、好奇心、驚喜和喜悅等情感使我們能夠規範自己的行為,並讓我們追求我們希望實現的目標。除此之外,我們通過情感表達自己內部狀態的能力是向他人溝通並可能影響他人決策的絕佳方式。
情感計算主要有「識別」,「表達」和「決策」這三個研究方向,「識別」主要是研究如何讓機器準確識人類的情感,並消除不確定性和歧義性。「表達」主要是研究如何把情感以合適的資訊載體表示出來,如語言、聲音、姿態和表情等。而「決策」則主要研究如何利用情感機制來進行更好地決策。
由於情感識別和表達都是研究歷史較長的領域,因此本文主要介紹情感識別和表達的相關概念,以及利用情感進行決策的最新進展。
1. 識別和表達
1.1. 識別
情感識別是一個歷史比較悠久的研究領域,最早可以追溯到上個世紀就有學者從各個角度研究情感識別,比如語音、語言、表情和姿態等。它旨在從不同的維度精確捕捉人類的情感表達,主要有兩種描述模型可以對情感空間進行描述,一種是離散情感空間,一種是維度情感空間。
離散情感空間把每一種情感分為一個個獨立的標籤,相互之間沒有關聯性,如喜悅、難過、恐懼等情感。這種描述方式更符合人的認知與日常生活的表達形式,具有天然的可解釋性。但是缺點在於不同的情感標籤之間沒有類似於數值向量的連續性,於是不同標籤之間的差異和聯絡性就無法更好地計算。