能動嘴就別動手!研究表明語音識別的速度、正確率完胜鍵盤輸入
別忘了語音識別還有一個硬傷:方言。
雖然語音識別技術的發展已經成為了目前人機互動方式的一大潮流,但事實上諸如蘋果Siri以及微軟Cortana等語音助手對很多人來說都非常雞肋,比起使用這些智慧語音識別軟體,人們更依賴於敲擊鍵盤表達訴求。而這在一定程度上也與人們對智慧語音助手的傳統印象有關,錯誤率高、識別速度慢成為了其最大硬傷。
但近來,研究人員的一項測試卻表明:和人們手動鍵盤輸入相比,語音識別反而能更快、更準確的組織文字訊息。
來自美國史丹佛大學、華盛頓大學和中國百度的研究人員以iPhone為物件進行了一項“人機挑戰賽”:一方為32名年齡介於19歲至32歲的打字高手,另一方則為百度矽谷人工智慧實驗室去年釋出的“深度語音2”軟體,雙方分別以打字方式和語音方式錄入了約100條日常短語。
有意思的是,這場比賽還是中英雙語的。打字錄入的一方中,半數實驗物件以iPhone上的 QWERTY 鍵盤輸入英文字母,而另一半實驗物件則是藉助蘋果手機作業系統中所包含的漢語拼音輸入法錄入中文。
比賽最終的結果卻讓所有人都大跌眼鏡:無論是中文還是英文,語音識別都要比鍵盤輸入更加快速、更加正確,而且還是絕對優勢勝出。
具體來看,英文錄入時語音識別比打字快三倍,錯誤率低20.4%;中文錄入時語音識別比打字快2.8倍,錯誤率則低了63.4%。
對於實驗結果,研究人員也表示出了驚訝:“我們之前知道語音識別的效果還不錯,預期的識別速度會比鍵盤打字快一些,但結果且讓人驚訝,這一速度幾乎快了3倍。”
據悉,研究人員此次實驗的目的就是為了以定量的方式為語音識別技術“正名”,藉以鼓舞工程師們更多地運用這項技術,來為更多應用軟體開發語音操作介面。
原文釋出時間:2016-08-27 18:42
本文作者:陳李
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。
相關文章
- 樹莓派語音互動--語音輸入識別樹莓派
- 手動輸入圖片識別
- JavaScript的語音識別JavaScript
- 語音識別模型模型
- 越來越普及的OCR “手寫”輸入不如“識別”輸入!
- python語音識別入門及實踐Python
- 語音情感識別--RNNRNN
- 語音識別技術
- Java - 4 鍵盤輸入語句Java
- 直播app系統原始碼,輸入完內容後自動隱藏軟鍵盤APP原始碼
- Arctime自動分軸怎麼用? Arctime語音識別自動加字幕的技巧
- 一、Windows10平臺下Unity3d的語音識別——關鍵字識別WindowsUnity3D
- 人臉識別 — 活體檢測(張嘴搖頭識別)
- 人臉識別 -- 活體檢測(張嘴搖頭識別)
- Mac監控鍵盤輸入並執行動作Mac
- 語音識別的最終目標是真正實現人機互動
- Lingua:能準確檢測與辨識自然語言型別的Rust庫型別Rust
- 低延遲流式語音識別技術在人機語音互動場景中的實踐
- OpenCV-Python 人臉眼睛嘴識別OpenCVPython
- ASR-使用whisper語音識別
- 人工智慧 (08) 語音識別人工智慧
- Swift-語音識別、翻譯Swift
- Python語音識別終極指南Python
- 輸入框跟隨鍵盤彈出/隱藏移動
- 獨家揭秘 | 深信服超融合卡慢盤識別準確率高達99%
- 怎麼關閉win10語音識別 win10如何關閉電腦的語音識別Win10
- 如何識別 oppo 手機安裝 apk 得驗證碼 如何進行 識別並輸入APK
- iOS 使用正則判斷輸入型別iOS型別
- 人工智慧之語音識別(ASR)人工智慧
- [譯] 使用 WFST 進行語音識別
- 百度API---語音識別API
- 語音識別2 -- Listen,Attend,and Spell (LAS)
- 谷歌手機輸入法可以離線語音識別了!模型精度遠超經典CTC谷歌模型
- Go語言的識別符號、關鍵字、字面量、型別Go符號型別
- Java日期時間API系列39-----中文語句中的時間語義識別(time NLP 輸入一句話,能識別出話裡的時間)原理分析JavaAPI
- 劍橋大學:研究發現手機打字速度快趕上敲鍵盤的速度
- 騰訊優圖實驗室AI手語識別研究白皮書AI
- 如何確保已正確識別和捕獲所有業務流程? - modernanalystNaN