自2011年Siri首次出現在iPhone 4S上以來,語音助手已經從一種華而不實的噱頭變成了智慧音響技術的根基。未來的AI語音助手還會進化成什麼樣的高度呢?

如今,智慧音響已經滲透到了美國六分之一的家庭。

尖端人工智慧語音技術開發商Nuance Communications的創新主管湯姆•赫伯納(Tom Hebner)向Digital Trends表示:“在Siri出現之前,當我談論(我所做的)事情時,人們的眼神都是茫然困惑的。人們會說,‘是你們開發了那些可怕的手機系統嗎?我恨你們。’當時人們對於語音技術都是這樣的反應。”

但今天情況已經截然不同了。據市場研究機構eMarketer預測,到2020年,將有近1億智慧手機使用者使用語音助手。儘管人工智慧助手不再是新鮮事物,但我們仍處於該類技術的進化初期。要完全兌現語音助手作為一個產品類別的潛力,仍然長路漫漫。

目前,可以從以下五個方面來讓AI 助手變得更智慧、更高效,從而幫助我們過上富有成效的生活。姑且把它們稱為“預測”或“願望清單”,畢竟它們都是些需要解決的挑戰。

1)充實專業知識庫

亞馬遜的AI語音助手Alexa可以告訴你各種各樣的東西,比如:馬來西亞吉隆坡的天氣狀況;總共720南非蘭特可以兌換720美元;生僻複雜的單詞如何拼寫。但從本質上講,消費級人工智慧助手就相當於數字世界中一個擁有一整套最新百科全書的人。你從它們那裡得到了正確的資訊,但它們並不具備專業級別的專項知識。

赫伯納在接受Digital Trends採訪時表示:“你家裡的智慧裝置所面臨的挑戰是,它們嘗試給你解決的事情太過寬泛了。”

這是一個很難解決的問題,但一旦解決了,就能產生顛覆性的影響。Nuance開發了許多針對特定用例的專家級系統,比如幫助航空公司客服回答客戶的問題,或者幫助醫生做筆記。這樣做不僅意味著這些系統可以深度獲取更詳盡的資訊,還意味著它們可以產生更多的智慧。“人們對能夠理解單詞意思的計算機感到非常興奮,但如果計算機不知道該如何作出迴應,那就不一定有意義了。”赫伯納說道。

他列舉了一個例子:一個Nuance系統不僅能理解醫生跟病人說的潛在藥物清單,還能指出那些藥物之間潛在的衝突。這遠遠超出了大多數消費級人工智慧助手的能力。

然而,AI助手在不同領域擁有更專業、更詳盡的知識——Alexa技能暗示了這一點——可能是革命性的。從表面上看,向你的智慧助手尋求法律或醫療方面的專業建議聽起來很瘋狂。但業界在法律機器人等領域已經取得了非凡的進步,最近釋出的一份報告也顯示,蘋果希望到2021年Siri能夠與使用者進行以健康為主題的對話。

人工智慧助手的專業知識圖譜可謂兌現了科幻小說的情節,最近釋出的Voicebot.ai報告也顯示,虛擬助手的技能集正在迅速擴大。隨著它們進入各個專業領域,我們將會受益不淺!

2)更強的個性化功能

今天智慧音響的個性化還處於起步階段。你可以改變語音助手的口音和性別表現,為其新增或刪除技能,給它輸入一些資訊,比如你的名字和工作地點。在某些情況下,你可以設定多個語音配置檔案,以便谷歌的Google Home能夠識別你家中的各個成員。

亞馬遜Echo Show智慧音響

但智慧助手在個性化上還有很大的提升空間——不過往這方面努力還是很值得的。Mattersight公司開發了一種名為“預測行為路由選擇”(Predictive Behavioral Routing)的人工智慧呼叫中心技術,該技術可以分析呼叫者的言語模式,並將其與性格相容的人類接線員進行匹配。根據該公司的說法,給呼叫者匹配性格相容的人類接線員有助於溝通順暢,相比匹配性格相沖突的接線員,通話的時間也能縮減一半。

使用類似的方法,可能會使得人工智慧助手會用你喜歡的方式與你交談。比如提供像匹配談話物件的口音和音量這樣的簡單的功能。或者,智慧助手也可以改變其表達方式,對某些使用者使用更有感情色彩的詞彙來表達感想,而不是像面對其他使用者那樣更多地使用細節性的資訊。也許有的人想要與語音助手進行長時間的交談,有的人則只是想要語音助手能以最簡潔的方式傳達必要的資訊。人工智慧助手應該同時具備這兩種能力。

像谷歌Duplex這樣的技術顯示出,人工智慧生成的合成語音和對話正在變得多麼地準確。隨著人工智慧涉足比迴應歌曲播放請求和設定食物定時器更復雜的任務,預計這項技術將會在我們的日常生活中扮演更加重要的角色。

這有望藉助語音識別技術的突破得到實現。赫伯納指出,Nuance的技術僅憑一秒鐘的音訊便能識別使用者身份。 “過去,語音識別技術需要10秒鐘的時間才能瞭解你是誰,才能得到準確的訊號。” 他說,“如今,這種技術威力非常強大。”這種技術能夠通過一小段語音識別使用者意味著它能解決密碼問題,也意味著你可以選擇使用語音助手來獲取相對微妙的機密資訊。

3)由被動變主動

優秀的助手會在你提出要求的時候給你做事,而卓越的助手則不需要你提出要求,而是能夠前瞻性地主動幫你解決問題。目前,人工智慧助手還處於第一個階段。使用者可以得到他們想要的歌曲,可以得到他們所需要的提醒,但通常只有在他們向語音助手明確提出要求以後才能得到。隨著人們越來越習慣於使用語音助手,它們有很大的機會從單純的被動型裝置轉變為主動型裝置。

你覺得人工智慧助手代表你做決定怎麼樣?這些建議可以是:當有人說他們覺得冷的時候,把恆溫器開啟;或者因為你遲到了,重新預約了一次午餐會議;督促你更多地進行運動鍛鍊,或者節省開支。隨著越來越多的智慧裝置進入家庭,語音助手可以控制的東西將會大大增加。

這在一定程度上是一個社會問題,即人們對讓機器做決策有多放心。人們是否願意把某些任務交給機器呢?這還存在很大的疑問。不妨將此想象成把你的信用卡和房子鑰匙交給你的人類助手。不好的地方在於,你得放棄一定程度的控制權。潛在的好處是你會有更多的空閒時間。當然,這是一個巨大的技術挑戰……

4)反饋機制

赫伯納指出了賦予語音助手主動性的一大挑戰:我們的機器如何知道自己做對還是做錯?說回“優秀的助手”和“卓越的助手”的概念上,卓越的助手會在一個大型會議之前把你所有的檔案都拿出來,而不需要你提出要求。但是,如果檔案拿的不對呢?讓家庭人工智慧助手變得更主動的一個大問題在於,目前只有有限的方法來揭示我們獲得的資訊是不是我們所需要的資訊。

Pepper人型機器人

“如果我每天走進家門都要聽同一首歌,然後有一天我走進家門,智慧助手就開始播放,它怎麼知道自己選對歌了呢?”赫伯納說,“如果我不停止播放,那是否意味著它選對了呢?如果我跟它說“停止播放”,那又是不是意味著它選錯了,不應該再播放那首歌了?反饋機制缺失,是你沒有得到更積極主動的智慧系統的原因之一。”

對於工程師來說,這是一個具有挑戰性的問題。任何有過被實習生就每一項任務徵求指導和反饋意見的經歷的人都知道,有時候自己親自做一項工作比委派別人去做來得更容易。人工智慧助手要能夠讓你的生活工作變得更順暢;而不是每天讓你做幾十個小調查來確認它的工作有沒有做對。這將需要以一種不會損害這些裝置的使用者友好性的方式來解決,並且在系統瞭解你的偏好之前不需要進行大量的預先培訓。

5)新的互動方式

科幻電影《2001太空漫遊》(2001:a Space Odyssey)有這麼一個場景:凶殘的HAL 9000——令人不安的是,它仍然是歷史上最著名的虛構人工智慧助手——揭示出,它不只是利用麥克風來判斷別人對它說了什麼。當兩名機組人員試圖選擇一個他們知道HAL 9000聽不見的地方說話時,HAL 9000透露,透過閱讀兩人的嘴脣運動,它仍然能夠知道他們說了些什麼。

很可怕吧?未來人工智慧助手或許也能這麼幹。

語音助手應該侷限於語音互動的想法,減少了它們與我們有效互動的潛在方式。隨著面部識別和情緒跟蹤技術日益興起,人們越來越多的生物特徵識別資料被不斷收集,讀心技術甚至也有可能出現,人工智慧助手可以使用大量不同的訊號來得出結論。

10年後,我們將只能使用語音來控制這些人工智慧助手的想法,就像在上世紀80年代初看到個人電腦時,會想,我們永遠不會再有別的帶有鍵盤的計算裝置。

來自:網易智慧