為什麼越像人的自然語言互動工具，越容易讓人失望？

naojiti發表於2019-04-24

原文網址 : http://blog.itpub.net/31561483/viewspace-2642447/

從有了Siri作為先例，擬人化已經成為了自然語言互動工具的必備能力。不論是服務於個人使用者的AI語音助手，還是企業提供的智慧客服，甚至是各種有語音功能的家用電器，都要做IP、造人設，幾乎有了成精之勢。

在大多數時候，我們認為自然語言互動的工具的擬人化可以降低使用者的“恐怖谷效應”，讓使用者更喜歡與其交流。但最新的研究結果卻表明，事實或許並非如此。

成為人類的千重套路

首先我們可以來看看，自然語言互動工具擬人化的“千重套路”。

第一步，給自己起一個人畜無害的名字。

我們常說，當你撿到一隻小動物後，如果給它起了名字，那麼它十有八九會成為你的寵物。AI也是一樣，當自然語言互動工具擁有姓名，基本就註定了它會在成精的道路上越走越遠。自然語言互動工具的名字通常是“小”字輩，既顯得弱小無害又無關性別足夠政治正確。

第二步，利用語音生成技術模仿人類語氣。

擁有了名字之後，肯定就不能再用冷冰冰的電子音了，甚至以往語音生成技術管用的真人錄音+規則匹配的模式也略顯死板。這時便出現了以谷歌WaveNet為代表的神經網路語音生成，通過對真人說話方式多種特徵的抓取，對語義、詞性、語法包括上下文等等引數綜合考慮，最終生成谷歌助手那樣像真人一樣說話會停頓、有思考的語氣。

第三步，讓對話內容更加人性化。

在自然語言互動的過程中，語音生成需要建立在文字內容之上。滿足了“說話語氣”的擬人化，同樣也要讓“說話內容”更加人性化。這時語義理解、多輪對話、自然語言生成等等技術的成熟度就變得非常重要。例如微軟在微軟小冰上應用的全雙工自然語言互動，就能實現“邊聽邊想”和“節奏控制”——通過整個對話過程對使用者意圖進行理解，減少使用者的等待時間，並且能夠主動引發新話題打破沉默，自行調節回答的內容和時機。這樣的對話內容通過語音生成技術“展現”出來，就可以以假亂真，讓人以為自己真的在和人類對話。

最後一步，披上“人皮”。

除了技術之外，還要以一些外圍模式讓自然語言互動工具更加擬人化。比如為它們設計一個可愛的卡通形象，增加幾條指令讓它們學會一些撒嬌賣萌的口頭語，在互動介面上增加一些細節讓人們意識不到他們在與機器對話等等。

有了這幾步套路，基本就能塑造出一個“化作人形”的自然語言互動工具了。

越人性越可愛?自然語言互動工具的期望值管理

可我們從未想過的一個問題是，在實際應用時，自然語言互動工具真的越擬人化越好嗎?最近賓州州立大學媒體效果研究實驗室就進行了這樣一項實驗。

研究人員們告知志願者，他們將在電商平臺中選購數位相機，並需要和線上客服交談諮詢。這些客服背後都是智慧自然語言互動系統，但研究人員對其進行人性化和響應程度上的區分。不同組的志願者們分別會接觸不同的線上客服系統，有在對話時直接告知對方自己是機器客服的，有的只展示出對話方塊內容，有的會通過真人頭像和名字“偽裝”成人類。

同時這些擬人程度不同的智慧客服，又分別有著不同的響應程度。有些可以迅速精準的回答使用者問題，有的卻聽不懂人話顧左右而言他。

在互動過後調查實驗者的滿意程度時，結果卻令人意外。

在一般的邏輯中，我們會認為智慧客服在互動時響應程度越高，人們的滿意度自然也會越高。可實際情況是，在同樣的響應程度下，使用者的滿意程度是與智慧客服的人性化程度相關的。比如同樣的互動內容，明確知道對方是機器客服的實驗者就會給出80分的滿意度評價，而那些偽裝成人類的機器客服卻只能獲得60分的滿意度評價。原因是當機器客服表現出較高的人性化特徵時，使用者對他們的期望程度也會隨著上升，盼望著他們能和人類一樣幫助自己解決問題，如果得不到想要的答案，則會放大失望感。

其實在我們自己應用自然語言互動時也有同樣的感受，當語音助手、智慧客服等等產品不能解決問題還要強行賣萌講笑話時，我們的暴躁指數往往會呈直線上升。

說到底，自然語言互動的人性化與否是一個“使用者期望值管理”問題，有時過度提升使用者期望值反而會弄巧成拙。

做人容易，做工具難

但目前我們能看到一個重要的趨勢是，自然語言互動人性和工具性的發展程度是不均衡的。

從技術發展的難易程度來看，讓自然語言互動工具更加接近人類，遠遠要比讓自然語言互動工具更加有效容易得多。

不管是谷歌的WaveNet還是微軟的全雙工自然語言互動，都足以讓自然語言互動的發音模式、對話節奏等等細節無限接近人類。未來結合上計算機視覺層面，甚至機器人制作工藝層面的能力，我們可以打造出一個與人類無異的對話者。

其實在今天，我們就能看到諸如AI主播或harmony推出的索菲亞等等在視覺上極致人性化的“AI演說者”。

可這些自然語言互動解決問題的能力卻沒有因此提高。具體表現為：對於人類語料的理解還存在一定隔閡，尤其是小語種、老年人、兒童等等相對冷門的語料庫;對於不同領域詞彙的認知還不夠全面，很多時候涉及到一些垂直產業時，AI往往會進入知識盲區。

如此以來，幫助自然語言互動的“工具性”追趕“人性”或許將成為未來很長一段時間內的產業熱潮。例如建立各個細分產業領域的知識圖譜、累積詞彙庫，或收集不同人群不同方言語種的語料庫用於AI訓練。

在技術的不斷追趕之下，人們對自然語言互動工具的期望值不斷提高已經是一種必然，為了避免出現“短板效應”，我們或許應該投入更多精力去追求“人性”以外的東西。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31561483/viewspace-2642447/，如需轉載，請註明出處，否則將追究法律責任。

《自然·代謝》：氣味想象力越強，人越容易胖？
2023-10-29
這屆年輕人，為什麼越掙錢越窮
2021-11-01
618 技術特輯（二）幾百萬人同時下單的秒殺，為什麼越來越容易搶到了？
2021-06-16
讓一個人越活越幸福的5個方法
2024-04-08
比亞迪越來越像華為？
2022-06-30
為什麼 PHP 在 2024 年會越來越受歡迎：經典語言的意外迴歸
2024-11-15
PHP
免費視覺化工具為什麼越來越受歡迎？
2024-06-28
視覺化
科技愛好者週刊（第 121 期）：為什麼人類沒有越來越閒？
2020-08-21
switch健身環?為什麼越炒越“香”?
2020-02-13
為什麼前端工作越來越難找了?
2019-03-30
前端
為什麼女性內衣越來越貴？
2022-05-18
越迷信技巧越容易失敗
2024-05-31
Java找工作為什麼越來越難，有什麼技巧嘛？
2019-04-01
Java
雙11規則為什麼越來越複雜？
2020-11-12
為什麼線上辦公套件越來越流行
2021-07-03
套件
為什麼專案管理平臺越來越普及？
2021-03-29
專案管理
能力陷阱：能力越強，越容易失敗
2019-05-17
為什麼前端工程越來越愛使用 Monorepo 架構？
2021-12-20
前端Mono架構
為什麼雲辦公平臺被越來越廣泛的接受
2020-10-20
為什麼越胖越想吃？因為你胖到自己的大腦了！
2018-09-01
天美Z1技術美術負責人：複合型崗位為什麼越來越“火”了？
2022-06-02
為什麼我們越來越不喜歡用網站？
2020-06-30
網站
現代前端工程為什麼越來越離不開 Monorepo？
2021-10-17
前端Mono
看視訊選結局，為什麼互動視訊遊戲越來越多？
2020-03-20
遊戲
柯潔說，去年AlphaGo還比較接近於人，現在它越來越像圍棋上帝！
2018-03-06
Go
開發人員越來越重視安全編碼
2022-04-08
為什麼中國人沒有自己的程式語言？
2019-01-30
是什麼原因讓寶付感覺現在的錢越來越不經花？
2021-10-09
為什麼軟體測試行業越來越受歡迎？
2022-01-12
行業
C# 中的 is 真的是越來越強大，越來越語義化
2020-09-30
C#
為什麼越來越少的人用jQuery
2018-12-05
jQuery
為什麼我越來越喜歡用DDD — DDD架構篇（1）
2024-10-30
架構
【CTO變形記】有序定無序—為什麼越努力，越無力
2023-02-13
為什麼Web前端變的越來越複雜，變得更加難學了
2019-10-18
Web前端
為什麼越懂免費OA系統的客戶，越選擇點晴
2021-10-14
是什麼讓玩家的錢包越來越吃緊？聊聊暴雪遊戲的付費設計
2019-09-17
遊戲
美國企業為什麼越來越熱衷於囤積現金？
2020-03-19
為什麼媒介環境越複雜，廣告主的預算分配越簡化？
2019-12-04

為什麼越像人的自然語言互動工具，越容易讓人失望？

相關文章