語音識別技術受追捧,無法獨立工作的“速記神器”何時才能成為新亮點?

行者武松發表於2018-03-01

從當前來看,速記神器確實為特定人群所需。

近日,搜狗召開釋出會,正式推出其自研的速記神器——搜狗聽寫。這是一款能夠將語音實時轉變成文字的速記工具,擁有轉寫和聽寫兩種模式,主要面向記者、編輯、作家等文字工作者。

語音識別技術受追捧,無法獨立工作的速記神器能否成為行業新亮點?

由搜尋而知名的搜狗,在人工智慧領域似乎也玩的風生水起

眾所周知,搜狗以搜尋業務起家。除搜尋業務外,其在近年還因搜狗輸入法、搜狗高速瀏覽器等在行業內頗具名氣。

如果僅從以上這些來看,搜狗此次推出“搜狗聽寫”似乎顯得有些無厘頭。然而,搜狗CEO王小川曾表示,搜尋本身也是一種AI。

語音識別技術受追捧,無法獨立工作的速記神器能否成為行業新亮點?

回顧搜狗的發展史,除去初期產品,搜狗在其產品迭代或新品中都或多或少的運用到了人工智慧技術,例如搜狗雲輸入法、加入了雲端計算技術的搜狗輸入法5.0版本、兒童智慧手錶“糖貓”等。

很顯然,這一次搜狗將目光瞄準了語音識別領域,也似乎做出了點成績。搜狗語音互動技術中心總經理王硯峰表示,搜狗聽寫中涉及到了大量前沿技術,例如大規模的優質語音資料訓練和深度學習的技術能力積累等,不僅可應用於多個場景,其語音識別準確率也高達97%以上。

產品並無明顯差異化競爭優勢,搜狗聽寫要拿什麼去競爭?

從搜狗方面的介紹看,搜狗聽寫可提供兩種服務,語音轉寫和語音聽寫。此外,它還同時具備了邊聽邊改、無線標重點、多端同步、資訊分享等多個功能。而這樣的語音轉寫工具,似乎在行業內並沒有什麼明顯的差異化競爭優勢。

語音識別技術受追捧,無法獨立工作的速記神器能否成為行業新亮點?

除新鮮出爐的搜狗聽寫之外,科大訊飛的雲犀、思必馳的語音輸入板等,都是能夠將語音轉換成文字的工具。此外,僅在中國,除去普通話,大方言就有八種,各小地區方言更是多不勝數。這其中所涉及到的語音識別、語義識別、深度學習、演算法訓練等多個人工智慧尖端技術,難度不可謂不大。

很顯然,與一直致力於語音識別領域技術開發的企業相比,搜狗在專業程度及行業經驗方面都有不做。而除去這些專業性企業和產品之外,當下很多輸入法及搜尋工具也有類似的功能,搜狗並沒有賦予搜狗聽寫具有差異化競爭力的功能。在市場逐漸開拓的當下,搜狗想要憑藉搜狗聽寫搏得一方市場,顯然不容易。

技術+人工,AI至今未能真正做到全智慧

在語音轉化文字方面,除去偏C端的工具外,專業性系統或軟體也有很多,例如科大訊飛的聽見智慧會議系統。在大多數的專業性會議,主辦方都會聘請的專業速記人員。而與前幾年相比,現今的速記工作已經有了更多人工智慧的參與。

只是這其中存在著一個的現象,當前的語音轉寫技術並不能一力承擔整場專業性會議,還需要有專業速記員全程盯著,實時進行糾錯沒有識別出的內容、標點等。

語音識別技術受追捧,無法獨立工作的速記神器能否成為行業新亮點?

科大訊飛負責會議現場速記的一位專業速記員表示,在以科大訊飛聽見智慧會議系統為主導、沒有純正方言的情況下,正常會議速記工作的人工參與率是5%—10%。

不過,在人工智慧相關技術不夠成熟的當下,這樣的人工參與率已經是很低的了。雖然目前我們並不能做到完全智慧,但僅就速記AI領域來說,有了專業速記員的配合,不僅能夠保證速記內容的精準,還能為開發者提供更為直觀的現場反饋,為技術的進一步發展助力。

總結

隨著人工智慧相關技術的發展與前景的逐漸明朗,似乎所有行業都想在這一領域插上一腳,大公司更是不例外。當然,企業發展需要新鮮元素的加入,但如果只是為了與“AI”沾親帶故以獲得“宣傳”的理由,對於行業來說,這樣的企業或從業者也許就是毒瘤。

從當前來看,速記神器確實為特定人群所需,但想要讓這類產品成為剛需,還需行業者切實考慮使用者需求,儘快讓AI成為真正的全智慧技術。

原文釋出時間:2017-08-09 19:13
本文作者:伶軒
本文來自雲棲社群合作伙伴鎂客網,瞭解相關資訊可以關注鎂客網。


相關文章