機器現在可以識別憤怒、恐懼、厭惡和悲傷,而情感檢測已從一個研究專案發展到價值200億美元的產業。

檢測程式能通過讀取面部表情和行為發現潛在的恐怖分子嗎?這是美國交通安全管理局(TSA)2003年提出的一個假設,在開發這個專案時,他們諮詢了舊金山加利福尼亞大學心理學榮譽退休教授保羅·艾克曼(Paul Ekman)。幾十年前,艾克曼(Ekman)已經開發出了一種識別細微面部表情的方法,並將它們對映到相應的情緒上,這種方法被用來訓練“行為檢測人員”——掃描臉部觀察是否有欺騙的跡象。

但當該計劃於2007年推出時,卻面臨種種問題,比如警察利用該技術經常錯誤的逮捕嫌犯,更令人擔憂的是,該計劃據稱涉嫌種族歧視。

此後,艾克曼(Ekman)試圖與美國交通安全管理局的專案脫離關係,聲稱他的方法被誤用了,但分析人士認為,該計劃的失敗是因為艾克曼(Ekman)的一個過時科學理論;即情緒可以通過面部的分析客觀地推斷出來。

近年來,科技公司已經開始使用艾克曼(Ekman)的方法來訓練從面部表情中檢測情感的演算法,一些開發人員聲稱,自動情緒檢測系統不僅比人類更好地通過分析面部表情洞察真實的情緒,而且這些演算法也將適應檢測我們內心的感受,極大地改善了我們與電子裝置的互動。

但是許多研究情感科學的專家擔心這些演算法會再次失敗,基於錯誤的科學對我們的生活做出高風險的決定。

01、價值200億美元的大生意
情感檢測科技需要兩種技術:計算機視覺,用於精確識別面部表情。機器學習演算法,用於分析和解釋這些面部特徵表達的情感內容。
行人檢測攝像頭正在工作 圖/紐約時報

第二步通常採用一種名為監督學習的技術。通過這種技術,一個演算法被訓練出來識別它曾經見過的東西。基本的想法是,如果你在“happy”(“快樂”)這個標籤下顯示出成千上萬張笑臉的影像,當它看到一張上面有笑臉的新照片時,會再次把它識別為“happy”(“快樂”)。

研究生拉娜·艾爾·卡利歐比(Rana el Kaliouby)是最早開始試驗這種方法的研究人員之一。2001年,從埃及來到劍橋大學攻讀電腦科學博士學位後,她發現自己花在電腦上的時間比花在與其他人相處的時間更多。她認為,如果她能教電腦識別自己的情緒狀態並做出反應,那麼沒有家人和朋友在身邊時,她也不會那麼孤獨了。

卡利歐比(Kaliouby)博士階段的其餘研究都致力於解決這個問題。最終,她開發出了一種裝置,可以幫助患有亞斯伯格綜合症(Asperger syndrome )的兒童閱讀面部表情並做出相應的反應。她稱其為“情感助聽器”。

2006年,卡利歐比(Kaliouby)加入麻省理工學院的情感計算實驗室,在那裡,她與實驗室主任羅莎琳德·皮卡德(Rosalind Picard)一起,繼續改進和完善這項技術。此後,2009年,她們共同創辦Affectiva公司,面向市場銷售“人工情感智慧”。

一開始,Affectiva將她們的情感檢測技術作為一種市場研究產品出售,為廣告和產品做出實時的情感反應,他們找到了諸如瑪氏(Mars),家樂氏(Kellogg’s)和哥倫比亞廣播公司( CBS)這樣的客戶。如今,亞馬遜、微軟和IBM也將“情感分析”作為他們的面部識別產品之一,許多較小的公司,如Kairos 和Eyris也已經開始崛起,提供類似的服務。

除了市場研究以外,情感檢測技術現在還被用於監控和檢測駕駛員的身體損傷,測試視訊遊戲的使用者體驗,以及幫助醫療專業人士評估患者的健康狀況。

卡利歐比(Kaliouby)目睹了情感檢測從一個研究專案成長為一個價值200億美元的行業。她相信該行業將繼續發展壯大。卡利歐比(Kaliouby)預言,在不久的將來,這項技術將無處不在,並整合到我們所有的裝置當中,能夠“利用我們內在的、潛意識的、時時刻刻的反應”。

02、囊括87個國家750萬張人臉的資料庫
與大多數機器學習應用程式一樣,情感檢測的進展取決於訪問更高質量的資料。
展會上的面部識別軟體 圖/路透社

Affectiva公司表示,他們的情感資料儲存庫包含來自87個國家的750多萬張面孔,其中大部分是從收看電視或每天上下班行人的選擇性錄影中收集的。

目前,利用該技術可以將面部表情翻譯成對應的情緒,例如,如果他們看到眉毛低垂,嘴脣緊閉,眼睛凸出的面容,就會貼上“憤怒”的標籤。然後,這個帶有標記的人類情緒資料集就會被用來訓練演算法,該演算法會學習如何將皺眉頭的臉與憤怒、微笑的臉與幸福等等聯絡起來。

這種標註方法,在情感檢測行業中被許多人認為是衡量情感的黃金標準,它是由保羅·艾克曼(Paul Ekman)和弗裡森(Wallace V Friesen)於20世紀80年代開發的一款名為“情感面部動作編碼系統”(Emfacs)衍生而來。

這個系統的科學根源可以追溯到20世紀60年代,當時艾克曼(Ekman)和兩位同事假設世界上存在六種普遍的情緒——憤怒、厭惡、恐懼、幸福、悲傷和驚訝——這些是我們與生俱來的情緒反應,可以通過分析面部肌肉運動在所有身處不同文化的人群中檢測到。

為了驗證這一假設,他們向全世界不同地區的人群展示了面部照片,要求他們辨別他們所看到的情緒。他們發現,儘管存在巨大的文化差異,人類還是會將相同的面部表情與相同的情感匹配在一起。對於美國的銀行家和巴布亞紐幾內亞的半遊牧獵人來說,眉毛低,嘴脣緊閉,眼睛凸出的臉都意味著“憤怒”。

此後的二十年裡,艾克曼(Ekman)利用他的發現開發了一種識別面部特徵並將其對映到對應情緒的方法,潛在的前提是如果一個人的普遍情緒被觸發,那麼一個相關的面部動作就會自動地出現在臉上。即使那個人試圖掩飾情緒,真實的本能感覺也會“洩露”出來,因此懂得觀察的人可以捕捉到對方的情緒。

整個20世紀後半葉,這個理論被稱之為經典情感理論,開始主宰情感科學。艾克曼(Ekman)為他的情感檢測方法申請了專利,並開始將其作為訓練專案出售給CIA、FBI、海關和邊境保護局以及TSA,真實情感可讀的觀念甚至滲透到了大眾文化之中,構成了電視劇Lie to Me的理論基礎。

然而,眾多研究情感本質的科學家和心理學家對經典理論和埃克曼(Ekman)的相關情感檢測方法提出質疑,近年來,東北大學心理學教授麗薩·費爾德曼·巴雷特(Lisa Feldman Barrett)提出了一個強烈且持久的批評。

巴雷特(Barrett)在研究生時期首先遇到了經典理論,她需要一種客觀測量情感的方法,於是發現了艾克曼(Ekman)的方法。在回顧文獻時,她開始擔心潛在的研究方法有缺陷。具體地說,她認為通過給人們提供預選的情感標籤來匹配照片,艾克曼(Ekman)無意中“已經有了預設的答案”。

巴雷特(Barrett)和一組同事通過重新執行艾克曼(Ekman)的測試來檢驗這個假設。但他們不提供標籤,讓測試者自由地描述自己所看到影像中的情緒,具體面部表情和具體情緒之間的關係直線下降。

從那時起,巴雷特(Barrett)發展了自己的情感理論,在她的著作《情感是如何產生的:大腦的祕密生活》(How Emotions Are Made: the Secret Life of the Brain)中得以闡述,她認為,大腦中沒有由外部刺激觸發的普遍情緒,相反,每一次情感體驗都是由更基本的部分構成的。

她寫道:“情感是你身體物理特性的結合,是一個靈活的大腦,可以連線到所處的任何環境中,是你的文化和教養提供了這種環境,情感是真實的,但在客觀意義上不是說分子或神經元是真實的,與金錢一樣真實,這不是幻覺,而是人類一致同意的產物。”

巴雷特解釋說,把面部表情直接對映到所有文化和環境中的情緒,這麼做是沒有意義的,一個人生氣時可能會皺眉,而另一個人可能會向敵人禮貌地微笑,因此,評估情緒最好理解為一種動態實踐,包括自動認知過程、人與人的互動、具體經驗和文化能力。她說,“這聽起來很費勁,但確實如此。”卡利歐比同樣認為“情感是複雜的。”

這就是為什麼她和她在情感研究所的團隊一直努力提高資料豐富性和複雜性的原因。

除了使用視訊而不是靜止影像來訓練他們的演算法外,他們還嘗試捕捉更多的背景資料,比如聲音、步態以及人類感知之外的面部細微變化,她相信更好的資料將意味著更準確的結果,一些研究甚至聲稱機器在情感檢測方面已經優於人類。

但據巴雷特所說,這不僅與資料有關,而且與資料如何被標記有關,情感檢測公司和其他情感檢測公司用來訓練演算法的標記過程,只能識別巴雷特所說的“情感刻板印象”,就像表情符號一樣,這些符號符合我們文化中普遍的情感主題。

紐約大學人工智慧研究所的聯合主任梅雷迪思·惠特克(Meredith Whittaker)認為,基於艾克曼過時的科學構建機器學習應用程式不僅僅是一種糟糕的實踐,還會轉化為真正的社會危害。

她說:“你已經看到招聘公司使用這些技術來衡量應聘者是否是一個好員工,你還可以看到用於學校的實驗性技術,以觀察學生在課堂上是忙碌、無聊還是憤怒。卡利歐比表示,“這些資訊可以用來阻止人們獲得工作或改變他們在學校的待遇和評估方式,如果分析並非十分準確,那將會是一種傷害。”

卡利歐比也敏銳地意識到建立不同資料集的重要性。她說:“我們要確保訓練這些演算法時,訓練資料是多樣化的,我們需要代表白種人、亞洲人、膚色較深的人,甚至是戴頭巾的人。”這就是為什麼研究團隊要從87個國家收集資料的原因。

通過這個過程,他們注意到在不同的國家,情感表達似乎呈現出不同的強度和細微差別。例如,巴西人用寬而長的微笑來表達幸福,而在日本,微笑並不表示幸福,而是表示禮貌。情感分析解釋了這種文化差異,增加了對系統的另一層分析,彙編了卡里歐比所說的“基於種族的基準”,編纂了關於不同種族文化中如何表達情感的假設。

但正是這種基於種族等標記的演算法判斷讓惠特克(Whittaker) 擔心情緒檢測技術暗示了自動化面相的未來。事實上,已經有公司對某人成為犯罪分子的可能性進行了預測。

最近幾項研究還表明,面部識別技術更容易產生傷害少數族裔群體的偏見,去年12月發表的一篇文章顯示,與白人相比,情感檢測技術顯示出黑人臉上的負面情緒更多。

卡利歐比認為,情感系統確實有一個種族分類器,她承認,這項技術目前並非萬無一失。

選自:The Guardian

作者:Oscar Schwartz

編譯:網易智慧