語音助手鏖戰「全雙工」，車載會是一個好場景嗎？

曾响铃發表於2019-10-22

原文網址 : http://www.jiqizhixin.com/articles/2019-10-21-17

微信圖片_20191021133104.png

一方面，作為最接近自然互動的形式，全雙工已經成為智慧語音領域的“香餑餑”，各大AI語音巨頭都在積極佈局。

另一方面，車載場景的人機互動需求也越來越強烈，在手沒有被完全解放的情況下，駕駛員們對更自由、更隨性、更解放的語音互動有著更強烈的需求，全雙工為應用“剛需”。

與普通生活場景不同，車載環境的使用者手動操作更加不便捷，而同時又往往有諸多功能操作（例如關窗、開空調）、生活服務（例如導航）、娛樂消遣需求（例如聽歌），多樣化需求更需要更連續的對話體驗——如果每一個指令都要喚醒口令，不但使用者體驗不佳，從旁觀者看，這種互動方式也頗有些尷尬。

與此同時，有限空間裡的司乘對話，多人對話與人機互動疊加，加上駕駛環境的嘈雜，無疑對智慧語音提出了更嚴峻的挑戰。

於是，迫切的使用者需求加上龐大的商業價值空間，以及車企這些年對產品創新的渴求，在這場全雙工的鏖戰中，車載語音場景不出預料成了玩家競逐的焦點，全雙工+車載的“搭配”迎來廣闊的市場機會。例如，不久前的重慶智博會上，騰訊雲小微就聯合騰訊車聯展示全雙工語音互動技術，讓使用者對車載語音助手有了更多的好感和期待。

巨頭鏖戰全雙工，也推動“第三空間”競逐走向臺前

目前為止，車載+全雙工落地應用仍處於初期階段，技術研發與應用適配同步進行中。

1、車載全雙工，巨頭各有玩法姿勢

微軟在2018年3月底宣佈“全雙工語音互動感官”已完成產品化落地，“長程語音互動成為可能”，到2019年8月，又宣佈全雙工語言互動技術已經通過車載裝置完成測試，已經有了幾個測試合作汽車廠。

微信圖片_20191021133115.png

微軟的全雙工語音及其車載應用是小冰專案的延續，第七代微軟小冰的重心之一是實現車載商用，逐步由“玩具”轉向現實價值，車載無疑是當下最恰當的選擇。

而百度在押寶AI戰略的大方向下，全雙工技術的推廣十分積極。今年7月，小度助手升級的全雙工語音已經在小度在家智慧音響產品上使用，且開放賦能給更多智慧硬體終端。

入局語音互動領域較早的科大訊飛，在2019年5月底釋出了智慧物聯網作業系統iFLYOS 2.0，也在多個領域開始了全雙工互動技術的應用嘗試。

今年8月，重慶智博會上，騰訊雲小微全雙工語音技術也正式對外展示。依靠騰訊雲小微這些年在語音技術上的深耕，選擇了最為“剛需”的車載場景率先落地全雙工互動技術，試圖從最符合使用者需求的駕駛場景打頭陣，然後進行全域擴充。

車聯網與AI助手的結合，也是技術與生態基礎上的B+C的搭配，非常符合騰訊在ToB轉向過程中的一貫調性。

2、技術推動下，第三空間正由概念走向實踐

在很久之前，汽車就被認為是家庭、工作之外的“第三空間”，在歐美等汽車文化濃郁的國家，車的第三空間價值十分明顯。

但在中國，日常出行的屬性仍然佔據大頭，使用者進入車內，聽音樂、導航、調空調……在不用重複喚醒的情況下，很自然完成一套操作……把全雙工放到車載場景中，如果從汽車角度看，本質上是“第三空間”的一種強化。

拋開技術，從具體場景實踐來看，巨頭們在全雙工領域的佈局和競爭，也在推動“第三空間”競逐走向臺前，誰能讓使用者真正體會到車上服務的便利，挖掘這個空間的使用者價值，誰就能在車載場景中實現商業突圍，這本身也與汽車廠商求新、求變、謀求市場增量的需求相吻合。

第三空間的體驗塑造，將面對使用者痛點的“三重區分”的挑戰

離開汽車視角，從全雙工技術視角來看，其面臨的首要挑戰在於，如何在連續對話中還能擁有很高準確率和響應速度。

例如，從已有資料看，騰訊雲小微的全雙工語音互動技術，在30秒到90秒的時間範圍內（使用者自行設定），一次喚醒即可實現連續對話，過程中使用者可以隨時打斷機器的回答。

微信圖片_20191021144634.jpg

而除了全雙工的特殊能力，騰訊雲小微可實現車載複雜噪聲環境下喚醒率97%以上，語音識別準確率96%以上，意圖理解準確率高達98%。

這裡不去對比這些數字的優劣，畢竟多數語音助手都能拿出還不錯的成績，但它們至少說明 “全雙工”互動下，準確率仍能保持高水準。不過，在汽車有限的第三空間裡塑造使用者體驗，語音助手們還有三大硬骨頭要啃——實現使用者的三種“區分”需求。

1、在幾何級技術難度升級的基礎上，區分“情境”

騰訊雲小微稱包括播放音樂、導航、查股票、查天氣等眾多服務在內，使用者都可以通過語音指令，跟車機一次喚醒、連續應答、自然互動，這其中涉及一個很重要的問題：跨情境的全雙工服務。

目前的車載語音助手已經可以做到在一定場景內免喚醒，例如常用的聽音樂，想聽A歌曲又反悔，想聽B歌曲，機器自動識別不需要使用者多次喚醒。

而當場景需求延展後，全雙工語音技術就不得不面臨既要連續、又要跨情境“思考”的挑戰，而這又幾乎是汽車體驗的必須，內容、導航、查詢、裝置控制……區分場景是“全雙工”的必要技能。

很明顯，即便是人的溝通在轉換話題時也需要適應，機器在面臨這種情境跨越的全雙工語音時，其難度是乘法級的幾何提升，而非僅僅做疊加而已。

2、在複雜的對話環境中，區分“人”

與歐美不同，在當下中國汽車文化中，家庭單位屬於仍然強於個人單位，“每家都有車”而不是“每人都有車”。很多時候，車中不只有司機，而肯定有副駕駛等其他乘客。

所謂“第三空間”不只是為司機服務，也為所有乘客服務。

對車載全雙工而言，這又帶來一個特殊的問題，如何讓不同的人有屬於自己的完整體驗。如果把全雙工比作一個人，與之溝通時，司機或乘客肯定都希望他與自己的溝通是完整的。

從當前的解決方式來看，行業主要採用多音區設定：主駕喚醒之後，都是聽主駕的聲音，副駕的喚醒後，都是聽副駕的語音，理論上，另一個人要接入全雙工互動，必須重新喚醒，才可以開啟自己的完整對話體驗。嚴格來說，這是通過物理設定的替代性方案，並非機器對不同聲音的完全識別，而是通過聲音的來源區分“人”。行業內也正在發展的“聲紋識別技術”，直接辨別不同的使用者，或才是未來更為徹底的解決方案，不過這仍需要等待。

3、在豐富多樣的服務中，區分“需求”

智慧語音從一開始就是兩條腿走路：前端聽懂使用者說了什麼，後端根據使用者的個性化需求推薦給不同的內容、服務，或者執行某些操控指令。

放到車載全雙工這裡，其實問題擴充到了兩個層面：

怎麼聽懂是對機器說的，而不是對其他人說的（比如人和人聊天），不要誤解使用者的需求；

在確定是對機器的需求後，如何實現更為個性化的服務輸出，畢竟，如果使用者想吃點喜歡吃的，你隨便導航到了一個使用者不喜歡的店子，或者甚至使用者想要去放鬆一下，你給導航到了公司，這樣的連續互動也就失去了意義。

前者需要語音識別能力的極大加強，它還有許多細節需要用技術實現，例如騰訊雲小微稱其藉助雲端大腦，不但能理解使用者的話哪些是需要響應的指令，哪些只是使用者對別人說的話，這其中同樣涉及複雜場景需求問題，懂更多還要區分是不是需求，挑戰進一步升級。

後者，本質上可以視為個性化推薦機制的延續，考驗的語音助手背後的平臺資料能力，如何在儘可能短的時間內瞭解眼前的使用者，為其提供定製化服務，強化全雙工的“實質”支撐，而不是隻有花架子。騰訊雲小微打出“懂你所需”的旗號，通過訓練後推送定製化服務內容，這是全雙工技術的行業必然，只是看誰能更為準確。

對使用者而言，同樣是自然的互動，如同與人交流一樣，與一個“懂你所需”的全雙工語音助手互動，就像是熟人聊天，而與無法實現定製化服務輸出的機器互動，就像是在和陌生人聊天，其體驗差距無需多言。

微信圖片_20191021144643.jpg

全雙工語音助手趨勢不可避免，車載只是拼圖的一塊

幾乎不會有人否認，語音助手是人機互動必然趨勢。經過幾年的發展，在巨頭們的努力下，越來越高的語音識別準確率，各平臺飈出的準確率指標，本身就證明機器的“聽見”和“聽懂”已經逐步實現，剩下的是不斷完善的過程。

而“智商”問題一旦接近解決，“情商”問題就走向臺前，讓機器更貼近人，實現人性化、情感化，是語音助手必然的趨勢。

於是，全雙工等新技術不斷湧現。幾乎可以肯定的是，在未來，一方面全雙工必然要突破引數瓶頸，例如沒有30秒、90秒的區分，而是無限連續同時準確識別需求，就是如科幻片機器人管家那樣的無縫互動，這是語音助手發展的必然；另一方面，更多其他的科技將不斷湧現，例如多模態識別，將聲音、影像、環境等諸多因素整合來與使用者自然互動。

而顯然，雖然車載急迫需要全雙工等更多自然互動技術，但全雙工並不只會侷限於車載。幾乎所有巨頭的全雙工技術的“理想”都是全場景應用，即便是騰訊雲小微選擇以車載為典型，未來也必將在全領域發力——到目前為止，在出行領域之外，騰訊雲小微憑藉全棧AI能力及騰訊豐富的內容和服務生態，在文旅、政務、教育、智慧硬體等多個領域都有涉獵。

以硬體為例，騰訊雲小微AI應用解決方案已經輸送到機器人、智慧電視、智慧音響、智慧空調等多個品牌多款產品中，而且百度、科大訊飛、阿里等玩家都在積極佈局。

可以說，車載是全雙工最熱的區域性戰場，未來的全雙工將是全領域的戰爭，屆時，當物聯網真正全面落地時，汽車這樣的第三空間將融入一個相互連線、不分彼此的“唯一空間”，車載全雙工與家居、工作全雙工聯動，人與虛擬數字世界將實現無縫對接。

拭目以待吧。

車載語音助手會是下一個風口嗎？
2019-01-21
AI語音巨頭鏖戰語音晶片市場
2021-01-27
AI晶片
全雙工與半雙工技術解析及其應用場景
2024-05-11
微軟小冰：全雙工語音對話詳解
2019-02-10
微軟
微軟正式推出新一代全雙工語音互動技術
2018-03-23
微軟
起底語音對抗樣本：語音助手危險了嗎？
2018-03-06
車載小程式：BAT車聯網的又一個戰場
2019-05-14
BAT
AI諮詢會是下一個萬億市場嗎？
2019-05-20
AI
Digitas：85%的智慧音響使用者會購買語音助手推薦的第一個品牌
2018-09-13
Git
語音社交平臺受到關注語音社交平臺會是新風口嗎？
2022-02-28
這個備受海外玩家青睞的題材，會是國產遊戲下一個戰場嗎？
2020-07-22
遊戲
輸入法的新時代：搜狗、訊飛、百度鏖戰智慧語音
2020-07-13
語音助手市場來勢洶洶，亞馬遜Alexa 2019將會如何應對？
2019-01-22
亞馬遜
單工，半雙工，全雙工通訊區別
2018-11-12
Pindrop：78%的企業部署語音助手會選擇Cortana
2018-06-13
以機器人為入口構建老年人健康服務全閉環，養老會是AI的下一個「主戰場」嗎？
2019-05-06
機器人健康服務AI
語音助手Antenna（長期更新）
2024-10-03
Voicebot：亞馬遜Alexa是影響最大的語音助手
2020-07-31
亞馬遜
Voicebot.ai：2020年車內語音助手使用者報告
2020-03-10
AI
語音標註的具體應用場景
2023-01-09
證明socket是全雙工，read，write是相互獨立的
2021-02-22
賽博朋克（Cyberpunk）會是個好的遊戲題材嗎？
2020-10-14
遊戲
《展翅翱翔》會是下一個傳奇嗎？
2021-02-01
《全職高手》中的《榮耀》是一款好遊戲嗎？
2019-09-09
遊戲
Voicebot：2019年車載語音助理報告
2019-04-29
全雙工與半雙工技術解析
2024-06-15
聲音社交專題研究報告：以聲會友，場景多元（附下載）
2021-03-02
語音識別技術有哪些應用場景？
2023-01-10
VoxFromer：單目3D語義場景補全
2024-09-15
3D
縱觀手機市場，手機即鏖戰全面屏
2023-11-25
全雙工通訊的 WebSocket
2018-05-21
Web
學習Java是個好選擇嗎?
2023-11-21
Java
win10語音助手小娜怎麼開啟 win10語音助手小娜如何撥出
2020-08-15
Win10
詳解ASR語音轉寫場景下的應用
2023-01-10
無人機和鐳射雷達，會是一對好cp嗎？
2018-11-21
無人機
在一款音樂遊戲裡講個好故事，真的可以嗎？
2020-04-02
遊戲
一個 Pipeline 的使用場景
2022-06-09
App Annie談“雙印”市場：下一個機會在哪裡？
2019-11-08
APP

語音助手鏖戰「全雙工」，車載會是一個好場景嗎？

相關文章