語音識別技術受追捧,無法獨立工作的“速記神器”何時才能成為新亮點?
從當前來看,速記神器確實為特定人群所需。
近日,搜狗召開釋出會,正式推出其自研的速記神器——搜狗聽寫。這是一款能夠將語音實時轉變成文字的速記工具,擁有轉寫和聽寫兩種模式,主要面向記者、編輯、作家等文字工作者。
由搜尋而知名的搜狗,在人工智慧領域似乎也玩的風生水起
眾所周知,搜狗以搜尋業務起家。除搜尋業務外,其在近年還因搜狗輸入法、搜狗高速瀏覽器等在行業內頗具名氣。
如果僅從以上這些來看,搜狗此次推出“搜狗聽寫”似乎顯得有些無厘頭。然而,搜狗CEO王小川曾表示,搜尋本身也是一種AI。
回顧搜狗的發展史,除去初期產品,搜狗在其產品迭代或新品中都或多或少的運用到了人工智慧技術,例如搜狗雲輸入法、加入了雲端計算技術的搜狗輸入法5.0版本、兒童智慧手錶“糖貓”等。
很顯然,這一次搜狗將目光瞄準了語音識別領域,也似乎做出了點成績。搜狗語音互動技術中心總經理王硯峰表示,搜狗聽寫中涉及到了大量前沿技術,例如大規模的優質語音資料訓練和深度學習的技術能力積累等,不僅可應用於多個場景,其語音識別準確率也高達97%以上。
產品並無明顯差異化競爭優勢,搜狗聽寫要拿什麼去競爭?
從搜狗方面的介紹看,搜狗聽寫可提供兩種服務,語音轉寫和語音聽寫。此外,它還同時具備了邊聽邊改、無線標重點、多端同步、資訊分享等多個功能。而這樣的語音轉寫工具,似乎在行業內並沒有什麼明顯的差異化競爭優勢。
除新鮮出爐的搜狗聽寫之外,科大訊飛的雲犀、思必馳的語音輸入板等,都是能夠將語音轉換成文字的工具。此外,僅在中國,除去普通話,大方言就有八種,各小地區方言更是多不勝數。這其中所涉及到的語音識別、語義識別、深度學習、演算法訓練等多個人工智慧尖端技術,難度不可謂不大。
很顯然,與一直致力於語音識別領域技術開發的企業相比,搜狗在專業程度及行業經驗方面都有不做。而除去這些專業性企業和產品之外,當下很多輸入法及搜尋工具也有類似的功能,搜狗並沒有賦予搜狗聽寫具有差異化競爭力的功能。在市場逐漸開拓的當下,搜狗想要憑藉搜狗聽寫搏得一方市場,顯然不容易。
技術+人工,AI至今未能真正做到全智慧
在語音轉化文字方面,除去偏C端的工具外,專業性系統或軟體也有很多,例如科大訊飛的聽見智慧會議系統。在大多數的專業性會議,主辦方都會聘請的專業速記人員。而與前幾年相比,現今的速記工作已經有了更多人工智慧的參與。
只是這其中存在著一個的現象,當前的語音轉寫技術並不能一力承擔整場專業性會議,還需要有專業速記員全程盯著,實時進行糾錯沒有識別出的內容、標點等。
科大訊飛負責會議現場速記的一位專業速記員表示,在以科大訊飛聽見智慧會議系統為主導、沒有純正方言的情況下,正常會議速記工作的人工參與率是5%—10%。
不過,在人工智慧相關技術不夠成熟的當下,這樣的人工參與率已經是很低的了。雖然目前我們並不能做到完全智慧,但僅就速記AI領域來說,有了專業速記員的配合,不僅能夠保證速記內容的精準,還能為開發者提供更為直觀的現場反饋,為技術的進一步發展助力。
總結
隨著人工智慧相關技術的發展與前景的逐漸明朗,似乎所有行業都想在這一領域插上一腳,大公司更是不例外。當然,企業發展需要新鮮元素的加入,但如果只是為了與“AI”沾親帶故以獲得“宣傳”的理由,對於行業來說,這樣的企業或從業者也許就是毒瘤。
從當前來看,速記神器確實為特定人群所需,但想要讓這類產品成為剛需,還需行業者切實考慮使用者需求,儘快讓AI成為真正的全智慧技術。
相關文章
- 語音識別技術
- Windows XP語音識別技術(轉)Windows
- 無程式碼開發為何會受到追捧?
- 語音識別技術面臨的問題 (轉)
- 0219 - 怎麼才能成為獨立開發者?
- 語音識別技術竟然發展如此迅速
- 舊金山可能成為禁止面部識別技術的第一個美國城市
- 語音識別技術有哪些應用場景?
- HTML/CSS 速寫神器 Emmet語法HTMLCSS
- 科普丨一文看懂語音識別的技術原理
- Google Brain推出語音識別新技術、面部表情識別助力商業再發展|AI一週學術GoAI
- Rust為何無法成為超級語言?Rust
- 挑戰蘋果谷歌:更強大的語音識別技術誕生蘋果谷歌
- JavaScript的語音識別JavaScript
- 百分點感知智慧實驗室:語音識別技術發展階段探究
- 淘寶直播“一猜到底”——移動端實時語音識別技術方案及應用
- 語音識別技術與政務資訊系統結合
- 低延遲流式語音識別技術在人機語音互動場景中的實踐
- 聽懂未來:AI語音識別技術的進步與實戰AI
- 超六成受訪企業無法識別黑客入侵黑客
- 一個技術總監的忠告:精通那麼多技術,你為何還是受不到重用?
- 為什麼劃分了獨立的boot區以後grub不能識別(轉)boot
- 聲音識別技術真的能識別出蒙面聖戰士嗎?
- Amazon SageMaker新玩法——定製你的語音識別模型模型
- 獨立顯示卡與整合顯示卡的區別 獨立顯示卡與整合顯示卡優缺點介紹
- 即時通訊的語音回聲消除技術
- 年底了是時候學新技術了「GitHub 熱點速覽 v.21.52」Github
- C# 10分鐘完成百度語音技術(語音識別與合成)——入門篇C#
- 聊聊雙11互動主動法中前端技術亮點前端
- 語音識別技術發展漸入佳境 AI企業奮力前行AI
- 【Recorder.js+百度語音識別】全棧方案技術細節JS全棧
- OCR證件識別技術的功能特點
- UniRx精講(二):獨立的 Update &UniRx 的基本語法格式
- 亞馬遜語音助手 能成長為鋼鐵俠的賈維斯嗎?亞馬遜
- ai行為識別技術監控AI
- 語音識別----音高的處理
- 語音識別方向的資料
- 基於語音識別的會議記錄系統