除了智慧音響，AI語音還可以用在哪裡？

dicksonjyl560101發表於2019-08-31

原文網址 : http://blog.itpub.net/29829936/viewspace-2655650/

2019-07-26 17:03:47

source：apple

說起來可笑，每次我找不到眼鏡的時候，我都想拿出手機，給我的眼鏡“打個電話”，好聽聲辨位。

不知道有沒有人，開發這種功能？

不得不承認，在某些場景下，聲音具有很強的穿透力。也因此，智慧音響會被開發出來，一聲“小愛同學”省了我們不少力氣。

在智慧語音這條賽道，可發揮的場景，待開發的空間還很大，這裡列了幾個例子，供君參考。

充滿“人情味兒”的聲音

其實語音合成技術離我們很近，例如高德地圖裡志玲姐姐的聲音，讀書軟體裡有聲朗讀，科大訊飛研發的“訊飛留聲”還可以滿足你，10句話就可以復刻自己的聲音。

從早期“我-是-機-器-人”的機械聲，到如今我們聽到的Siri的回答，無論從音質、複雜度還是自然度上，都近乎無可挑剔。但是在技術迭代的過程中，表現力一直是語音合成技術亟待解決的問題。

唯真性高，但是“人情味”不足。

而提到“人性化”的聲音，最驚豔的莫過於去年驚豔亮相谷歌I/O開發者大會的智慧語音助手：

有沒有覺得，那句“Umm...”讓整個對話“真”了起來。

我們知道，人類在說話的時候會夾雜很多語氣詞，用來緩衝大腦思考問題。同樣，機器人進行資訊檢索的時候也需要時間，加入這些詞彙讓它們看起來更像人類。

一個會說人話的機器人，還是有機會殺一殺萌寵經濟的銳氣。

49秒，點了34杯咖啡

此前，《麻省理工科技評論》評選出的2019年“全球十大突破性技術”，“阿里AI 助手”是唯一上榜的國產技術。

原因在於專業技能過硬，僅49秒，點了34杯咖啡。

使用者只需要對點餐機進行與正常人一樣的對話就可以完成。

“五個巧克力、兩個香草拿鐵，巧克力加奶油。”“兩個中杯焦糖拿鐵，一個熱的一個冷的。”“算了巧克力不要了。”“再要六個小杯少冰摩卡，三杯加焦糖三杯加香草”“再加一個大的冷的拿鐵，去冰半糖加脫脂奶，打包。”

在雲棲大會現場，阿里語音互動首席科學家鄢志傑最快以每秒5個字的語速向一臺機器點單。

而人類咖啡師在第一次沒記住的情況下，重聽之後完成了訂單，用時2分37秒。

該系統不僅可以在公共場所強噪聲環境下進行訊號處理和語音識別，還融合了視訊識別與面部識別、場景感知等多模態的感知技術，同時更增加了多輪多意圖口語理解、業務知識圖譜自適應等認知技能。

這項技術除了可以替代收銀員之外，還被應用在地鐵裡。

據悉，上海地鐵已經部署了這一技術，乘客直接說出目的地，售票機便可選擇合適的站點和路線。

“語音流”裡的廣告位

在語音助手界，最紅的莫過於微軟小冰，寫詩、唱歌、主持、嘮嗑無所不能。據悉，微軟小冰作為“社交化人工智慧”已經在全球積累了過億使用者，產生了300億條的對話記錄。

source：微軟

如今的第六代微軟小冰，已上線全新的共感模型（即小冰可以通過自創迴應，來牽引對話向她所希望的方向進行）。她可以實時預測人類即將說出的內容，實時生成迴應，並控制對話節奏，從而使長程語音互動成為可能。

帶節奏，牽引對話，這是導購員最擅長的事情。

這是一個訊號。

品牌廣告主可以憑藉更具針對性、以語音為先的數字內容搶佔搜尋結果的位置。

也就是，“語音流”裡的廣告位。

這是是一片需要營銷人員去探索的空白區域。想想看，當語音助手的系統中，沒有資料來源或足夠深度的內容為問題提供答案時，品牌可以主動參與到對話中去。

生產力工具

在文章開篇，提到了給眼鏡“打電話”，那如果眼鏡可以自己發出聲音“我在這裡”會如何？

事實上，這件事情，已經有人做到了。

通用電氣開發出了一款原型機，它可以讓機車給維修技術人員傳送語音資訊，描述需要修理的東西。或者，它可以直接打電話給他，說“我的轉子有問題了，你快來修”。

其實，“機器自檢”這種模式，來自於通用電氣的Digital Twin。

專業術語小貼士（來自美國國防採辦大學DAU的術語）：

Digital Twin，即數字孿生，指充分利用物理模型、感測器更新、執行歷史等資料，整合多學科、多物理量、多尺度、多概率的模擬過程，在虛擬空間中完成對映，從而反映相對應的實體裝備的全生命週期過程。

換句話說，就是在虛擬空間中對工廠進行模擬和模擬，並將真實引數傳給實際的工廠建設。

通用電氣的Digital Twin專案不僅實現了工業資產的3D顯示，還可以處理從全球各個機器收集到的資訊，從而更好地為決策提供資訊。

結語

更多的語音應用場景，還有老羅釋出的TNT工作站，用聲音控制電腦的操作，一度引起網友吐槽，最終寥寥收場。

作為對比，在今年的WWDC 2019上面世的macOS 10.15 系統，也實現了語音控制Mac 裝置，不禁令人感慨：

語音互動會成為下一代主流互動方式嗎？

記得科大訊飛AI產品副總裁陳亮在一次演講中說：“AI用得好不好，關鍵在於用的人的想象力”。

所以，我們其實要考慮的是：如何在合適的場景，選擇合適的互動方式。

當我在跑步的時候，如果有一個虛擬語音助手可以直接告訴我應該如何調整呼吸和步伐節奏，我是希望與“它”進行對話的。

又或許，還有“會說話”的眼鏡......

https://www.toutiao.com/a6717895045518721550/

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/29829936/viewspace-2655650/，如需轉載，請註明出處，否則將追究法律責任。

除了唱歌，還能做手術！智慧音響咋有這麼大本領
2019-03-29
華為AI智慧音響全面評測華為AI智慧音響怎麼樣？
2018-11-13
AI
華為AI智慧音響“小藝”：同價位音質最出色的智慧音響
2018-11-13
AI
Voicebot.ai：2019年智慧音響報告
2019-04-12
AI
AI都能自主研發藥物了，全智慧語音還有多久？
2019-07-05
AI
小林同學智慧AI大模型語音助手
2024-07-12
AI大模型
YouGov：1/3的智慧音響使用者不知道語音錄音儲存在雲端
2019-07-30
Go
Spotify開始測試語音搜尋技術，或將打造智慧音響
2018-04-11
端到端智慧音響
2022-05-25
AI語音巨頭鏖戰語音晶片市場
2021-01-27
AI晶片
語音控制智慧插座
2018-11-09
智慧語音爬天井
2022-01-24
智慧音響的中局，勝負手在技術核心裡
2019-07-04
帶屏智慧音響，新一輪音響大戰的焦點？
2018-08-22
智慧音響在中國：63%的非中國智慧音響使用者打算在未來十二個月內購買智慧音響
2019-10-22
(乾貨)Ai音響和Linux音訊驅動小談
2018-11-15
AILinux音訊
小米語音首席科學家 Daniel Povey：語音識別卷完了，下一個機會在哪裡？| 智者訪談
2025-01-19
智慧語音機器人的價值體現在哪些方面？
2021-07-19
機器人
除了cookie，你還可以用jwt(json web token)！
2019-03-03
CookieJWTJSONWeb
智慧音響下沉市場速寫
2019-04-11
智慧音響 GO SMART2上市
2018-12-05
Go
智慧音響的“無限戰爭”
2020-06-09
Facebook的智慧音響跳，票，了
2018-03-29
智慧音響結束寡頭格局？
2021-01-05
AI語音+金融：一場智慧化變革在發酵
2019-11-20
AI
帶你玩轉OpenHarmony AI：打造智慧語音子系統
2022-12-23
AI
三星智慧音響8月9日亮相：內建Bixby語音、可觸控螢幕
2018-06-15
360推首款AI音響MAX 360AI音響MAX正式釋出，首發價僅199元
2019-03-29
AI
小愛音響mini開箱圖賞會說話的人工智慧音響
2018-03-28
人工智慧
語音識別新正規化：完全的“端到端”模型，優勢在哪裡？
2020-02-17
模型
Digitas：85%的智慧音響使用者會購買語音助手推薦的第一個品牌
2018-09-13
Git
Community Research：2022年智慧音響報告
2023-04-07
Unity
『1/3的智慧音響使用者不知道語音錄音儲存在雲端』今日資料行業日報（2019.07.30）
2019-07-30
行業
w10錄音在哪裡_win10系統怎麼開啟錄音
2020-07-04
Win10
insomnia在在哪裡聽 insomnia歌詞及中文諧音音譯歌詞全文QJ
2022-03-20
除了音訊和影片，HTML5還支援哪些媒體標籤？
2024-11-25
音訊HTML
人工智慧 (08) 語音識別
2019-12-22
人工智慧
智慧語音技術的深度解析
2019-03-04

除了智慧音響，AI語音還可以用在哪裡？

相關文章