探路人與解題者:騰訊數字生態大會上AI語音助手+X的無限可能

naojiti發表於2020-09-11

日本聲優(配音演員)花澤香菜官宣結婚的那一天,不少宅男都直呼“爺青結”(爺的青春結束了)。網際網路上被奉為“大眾情人”的男神/女神,哪個不是聲形並茂的存在?

“顏控”如人類的情感就是如此不講道理。所以儘管科技廠商們都努力將AI助手的聲音“打扮”得親切可人,但距離真正進入使用者心扉還遠遠不夠。尤其是對於智慧家居、養老照護等重要語音落地場景來說,情感色彩的缺位就更加顯現出不足了。

而近期,許多能說會道的AI人物,也逐步進入我們的視野。比如《時代週刊》刊發了一張馬丁·路德·金的“肖像照片”,“他”還會在沉浸式展覽《遊行》中,重現馬丁·路德·金的經典演講《我有一個夢想》。

在許多崗位上,AI語音助手也開始被賦予真人一樣的外貌,能夠通過眼神、表情、動作進行自然流暢的表達。比如疫情期間許多辦公樓裡,都引入了數字人來執行測溫任務,讓這一行為更具溫情,不再是機器語音例行公事一般冷冰冰的提醒。

騰訊全球數字生態大會上,一位來自《鏡雙城》動畫番劇裡的女主角那笙,就跟現場觀眾打起了招呼——“原本我只能出現在動漫世界裡,現在的我能夠讀懂你、聽懂你,還有自己的小個性、小脾氣哦~”

一副嬌俏少女的模樣,讓這樣的“女神”成為自己的導遊、助理、客服、老師等等,聽起來就十分令人神往,是騰訊雲小微和AI lab共同打造的數字虛擬人,也成為騰訊雲小微“數字助手”解決方案的“顏值擔當”。

當然,讓人類與數字助理自然相處,其中既受限於理性的技術發展週期因素,也會受到人類虛無縹緲的情感左右。那麼作為一種另闢蹊徑的實現方式,騰訊雲小微所打造的形象化AI助手,其想象空間到底來自哪裡?又將把AI語音技術引向怎樣的下一站?

“顏控”企業的出現,折射出哪些現實需求

智慧語音助手早已在許多商業場景中落地,比如撥打客服電話時的語音服務,亦或是會為兒童朗讀繪本的智慧音響。那為什麼大家突然又開始“看臉”了呢?

其實,從智慧語音助手中廣泛存在的手機/音響等產品的互動尷尬,就可以解開這個問題。

首先是開啟頻率。許多主打智慧語音功能的硬體(比如音響),只有在剛拿到手的新鮮勁裡,或者是網路上又出現了“調戲”語音助手的段子,才會想起來跟它們對話。背後的關鍵原因是語音助理所能承載的工具性需求,大部分都已經被智慧手機等裝置完成的很好了,只能作為“備胎”被偶爾提起。

二是情感聯絡。語音互動是即忘形式的,這就決定了它無法承載更具私密性、情感性的互動活動。我們會讓語音助手幫我們開啟電視、啟動掃地機器人,但跟它進行充滿情緒色彩、大段大段地閒聊?估計大部分使用者都會產生牴觸心理。就算自己不介意,被其他人撞到抱著一個音響喃喃自語也很難不引起誤會不是……

三是技術瓶頸。伴隨著NLP技術的進步,語音助手已經能很不錯地完成聲紋識別、多輪對話、語義理解等複雜任務了,但距離自然交流顯然還有一定的差距。動不動就“我聽不懂”“難倒我了”,娛樂消費產品會被棄之高閣,萬一企業不小心聘用了這種“智障型”AI助理為消費者提供服務,難以達到普通使用者期盼的準確無誤、近似真人的互動效果,帶來的就可能是訂單的損失和品牌口碑的下跌。

針對這些AI語音助手在產業端、市場端的落地尷尬,存不存在可能的解決之道呢?從“工具人”轉變為“數字人”,讓使用者從“聲控”轉變為“顏控”,就是騰訊數字生態大會上給出的一個十分吸睛的解題思路。

讓使用者跟AI多聊兩句,數字助理需要具備哪些超能力?

“如果那笙哪裡做的不對,主人不要嫌棄我我有在努力呢”——試問聽到這種對話,你還會吐槽語音助手偶爾出現的小失誤,甚至還有點想反思自己是不是過於吹毛求疵了呢?

沿著這個思路,我們可以看到形象化之後,騰訊雲小微在數字助手領域都打造出了哪些超能力:

1.語音+視覺互動,藉助騰訊系海量IP打造出各種形象、生動、貼近現實需求的形象,提升互動頻率,從而真正有效地減輕人類工作負擔。比如疫情期間,就有老師表示希望有分身到每個學生身邊指導他們,而數字助理的擬人化互動恰好可以完成這一任務;

2.豐富的知識體系,利用知識圖譜與深度學習技術,數字助手可以快速呼叫海量資訊,完成問答、資訊等服務,再通過擬人化的形象輸出給使用者,人們會在服務過程中對技術產生一定的包容和理解。為故宮打造的清朝內閣大學士“福大人”,就擔任起了知識淵博的遊覽助手;

3.個性化情感關係:智慧語音助手等新鮮事物的核心受眾群以年輕人為主,而隨著國漫崛起,年輕人對標新立異的虛擬形象更感興趣。而對於渴求增長與變化的企業來說,與其按部就班地在聲音世界裡打轉, 尤其是線上上化業務增多,使用者的互動頻率和方式增長的情況下,年輕市場也需要新的服務形態來被重新啟用;

此外,伴隨著產業數字化程度的推進,企業想要在資料洪潮中傳達出具象的品牌形象,新的視覺載體是不可或缺的。消費者的行為和決策鏈路也在數字世界中變得更加隱蔽、複雜,如何保持黏性,建立使用者與品牌的情感連線也成為應有之義……

上述種種,或許都可以通過一個人格化、陪伴式的“數字助理”,來觸發全新的可能性。

AI語音的下一站,開啟人機互動的“寧靜時代”

技術領域有個名詞叫“寧靜技術”,簡單來說就是通過對使用者的情景感知能力,最小化使用者的注意力,讓人機互動變得隱匿和不可見(invisible)。

就像進入電梯間之後按下樓層鍵一樣,已經成為現代人潛移默化的慣性動作,誰還記得曾經按電梯也是一種職業,甚至需要考證呢。

而人機之間的語音互動,也正在從“好像有點尷尬”進入到自然而然地喚起階段。接下來,就是要讓這種已經在一些場景(比如客廳)成為習慣的事,隱匿到更大的社會空間之中,讓AI助手能夠在更廣闊的商業世界裡與人們自然順暢地進行交流。

這既是技術發展的必然趨勢,也離不開科技企業們的不斷努力。以騰訊雲小微AI語音助手為例,就已經在出行、文旅、教育等等領域開始落地。

之所以能達成這一成就,首先來自於騰訊在語音技術上核心技術鏈的深耕。

通過ASR、NLP、TTS等技術,對聲音進行降噪、文字轉化、語義理解,這一才能讓AI助手能夠在複雜環境中依然能夠識別不同的方言或者口音。

想要達成和真人一樣的交流,機器還需要聽得懂,才能避免“所答非所問”的情況,來真正幫助使用者解決問題,成為一個業務能力強大的“數字員工”。因此騰訊除了在語義技術方面發力之外,還十分重視知識圖譜的建構。等於為AI搭建了一個先驗的知識庫,讓它能夠及時調動龐大的知識儲備,更好地理解使用者言語的意圖,來顯示出“智商很高”的樣子。

除此之外,數字員工的“情商”也很重要。利用利用個性化、沉浸式的TTS語音合成技術,再結合虛擬人技術,將對話內容以多模態、多層次的形式表達出來,就能很好地通過表情、動作傳達出語言的情緒,讓使用者更加可感、可知。

而這一整個技術體系要真正落地,一方面需要打通資料閉環,從而訓練出更可靠、精準的對話模型。因此騰訊雲小微團隊也建構了一套系統工程。從沒有資料怎麼辦開始,系統地鑽研資料如何打通,推動資料共享,到缺失資料的採集,系統化地為客戶規劃了基於資料智慧化目標的資料採集和資訊化建設方案。

另外,數字助理的最終目標不是“賣萌”,而是幫助企業提質增效,推動數字生產力變革,達成體驗/服務到業績/留存的真實轉化。因此要具備統籌全域性、貫穿業務週期的能力。所以也需要對企業的全業務場景進行覆蓋,來保證無論是簡單的問題諮詢,還是複雜的業務流程辦理,抑或只是想跟數字員工閒聊談心,背後的語音技術解決方案都能夠通過正確響應來滿足使用者所需、企業所想。在這一點上,騰訊雲小微也通過流式語義+語義VAD技術,讓AI在極低時延的情況下也能邊聽邊思考。

也正是“資料+業務”的雙重閉環,形成了數字助理進入產業規模化的能力譜系,得以為企業智慧化轉型全程護航。

AI語音助手+X=無限可能

毫無疑問,數字化、智慧化潮流的全面噴發,未來會有更多的數字助理、AI助手被納入到人類的工作環境當中。對於廣大普通人來說,數字助理的能力蝶變真的有現實意義嗎?

答案是肯定的。可以預期的是,至少有幾種社會生活會被革新:

一是文旅導遊。一場疫情讓旅遊行業元氣大傷,而防疫的“持久戰”也決定了限人限流會成為一段時期依賴的常態,如何在這樣的情況下依然保持甚至超越原有的服務質量,將基礎講解工作交給數字員工,就是一個不錯的選擇。未來走進景區,開啟手機,也許就是一個數字導遊引領我們遊覽,實時講解,互動答疑;

二是家居場景。你的家裡有多少智慧音響在等著落灰?年邁的父母呼喚語音助手的名字時是否還是會感到一絲尷尬?而一旦語音助手有了數字形象,被賦予擬人化色彩之後,一切可能都會變得不同。從原本的一問一答,到有情感、更自然的交流,大概率會有不少人開始發帖“我覺得家裡的AI助理才是我爸媽親生的”。

三是教育產業。一進九月臨近教師節,家長群們總少不了“送禮物擔心老師不收,不送禮物擔心孩子得不到關照”的年度討論,而現實中,確實存在老師無法針對學生進行一對一特定輔導、難以記住所有學生的學情狀況、教學壓力大等情況。能化身虛擬老師的“數字助手”,無疑就是妥妥的多贏,老師們得以從機械工作中解放出來,學生們也能得到實時、個性化的輔導,而家長們也不用發愁怎樣才能在AI眼裡刷存在感了。

三是智慧營銷。對於企業來說,數字助手不僅僅是一位德智體美勞全面發展的優秀員工,還可以是輔助商業營銷決策的“超級智囊”。舉個例子,一些汽車小白使用者,通過網際網路的消費行為偏好分析,進而設計出一些“傻瓜式”產品功能,比如一鍵詢問維修、一鍵呼叫客戶、智慧導航、輔助駕駛等等,而這些使用者洞察,基於騰訊雲小微所處的數字生態都可以轉化為車機企業爭取潛在使用者好感度的關鍵武器。

一個能聽會說、知識全面,又善於表達、喜怒形於色的數字員工,擁有的可能性還有很多。不難發現,不僅企業需要重新認知數字助理所帶來的價值紅利,想要擴大數字助理的商業價值與應用邊界,還需要一套體系化的平臺性技術解決方案,來降低各行各業引入數字員工的門檻及成本。

從這一點來看,數字生態大會上所展示的人機互動技術前景與商業巨集圖,不是一種偶然,而是騰訊雲小微從長期實戰與技術研發中生長出來的確定性。

騰訊雲小微扳動了一下技術齒輪,人與機器如同精密儀器適配一樣,在某個瞬間發出“咔”的一聲,於是我們知道,一個全新的產業世界大門,開啟了……

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2718839/,如需轉載,請註明出處,否則將追究法律責任。

相關文章