搜狗AI走向產業改造:縱橫捭闔術與錄音筆的新聲態

naojiti發表於2019-08-29

昨天,搜狗舉辦了一場名為“全新「聲」態,AI未來”的釋出會。而這場釋出會中的主角之一,竟然是我們熟悉又陌生的錄音筆。

說錄音筆這款產品熟悉,大概是它曾經是很多大學生上課時的標配,對於腦極體這樣的文字工作者來說,更是採訪時必不可少的工具。但說它陌生,是因為不知不覺間,這款產品似乎已經遠離主流電子消費品市場很久了。據新思界產業研究中心釋出的《2019-2023年錄音筆行業深度市場調查及投資策略建議報告》顯示,2017年至今,我國錄音筆行業出貨量增長已基本停滯。隨之而來的,是市場上產品開始出現大規模的同質化現象,廠商如何抓住日新月異的技術機會,如何在市場中博得生機,都成了眼下急需解決的問題。

搜狗在釋出會中究竟提出了哪些舉措,這些舉措又能否幫助錄音筆產業突破當前的困境?

錄音筆是如何逐漸被手機替代的?

在解答這些問題之前,我們要先弄清楚,錄音筆到底怎麼了?

雖然錄音筆比不上手機、耳機等等產品的普遍需求程度,但在教育、企業會議、採訪等等場景中,錄音筆本應有其穩固的需求市場。為什麼在今天會出現如此嚴重的產業萎縮現象呢?

對錄音筆產業衝擊最大的,當屬手機功能的進一步完善。隨著手機收音和降噪技術的不斷提高,在一些噪音干擾不那麼強的場景中,開始有越來越多的人選擇用手機替代錄音筆。

同時AI技術的不斷提升,也進一步削弱了錄音筆的應用價值。對於工作處理來說,音訊處理的效率顯然是遠低於文字的,即使是在使用錄音筆時,我們常常也是匯出錄音,透過軟體轉換成文字。而現在大多數AI語音轉錄軟體均在移動端有所佈局,讓手機錄音轉文字變得非常方便。甚至還有不少AI企業在嘗試挑戰人工速記的“實時轉錄”。這時錄音筆不管是透過隨身碟還是藍芽傳輸錄音檔案再進行轉換,都顯得多了一重麻煩。

但即便如此,錄音筆仍然具有其不可替代的價值。像很多場合,尤其在學校中,是不適宜攜帶手機的。而且相比手機,錄音筆的續航能力和簡便操作仍然佔據優勢。

如今這一產業需要的,是在技術和產業生態上重塑新生。

搜狗AI錄音筆寫下的起點

迴歸主題,這一次釋出會中,搜狗提出了兩項舉措,一項是向錄音筆行業開放搜狗聽寫服務,另一項是聯合愛國者、紐曼、索尼錄音筆、萬成集團等等傳統錄音筆廠商,成立了AI創新聯盟。

想要理解搜狗的縱橫捭闔之術,我們可以先從搜狗AI錄音筆C1這款產品說開去。

搜狗AI錄音筆C1釋出於今年春天,在這次釋出會上又推出了具有全新外觀的炫彩版本。除了常規透過降噪演算法、自動增益等等技術提升錄音質量之外,搜狗AI錄音筆C1還提供了一系列創新功能——錄音轉文字、同聲傳譯、雲端儲存。也就是說,在錄音過程中,音訊就會被轉換成文字,還可以透過雲端儲存來實現跨終端操作。

這樣一來,應用錄音筆再也不需要在手機、電腦之間傳來傳去,或是來回復聽轉寫,就能實現高效的文字編輯。

這款產品的推出,實則是對錄音筆工具屬性的重新賦予。錄音筆從此從一款提供錄音的工具,變成了將現場錄音轉換成文件的工具。

這種程度的效率提升,是足以撬動市場的,搜狗AI錄音筆C1在極短時間內就在多個電商平臺取得了單品銷量第一的位置。但對於錄音筆這一整個產業來說,光有一款產品顯然不足夠。

縱橫之術:一劑給予錄音筆產業的技術療法

搜狗的縱橫術,就是開放出已經在自己產品上成功試驗的聽寫服務技術體系給整個行業,透過一劑精準的“技術療法”,在當下來讓整個錄音筆行業重煥活力。

簡單來說,縱橫術給予了錄音筆行業兩方面的賦能。

一方面是技術賦能。

搜狗作為輸入法領域的老玩家,與語音轉寫技術打交道的時間和頻率都很高。在實時語音轉寫中,搜狗應用的是自研的延遲可控的Adaptive Attention-based模型;在非實時語音轉寫功能上,則使用了業界領先的Transformer-based端到端語音識別技術。兩種技術的結合滿足了不同場景下的需求,也讓語音轉寫準確率達到了95%以上,並支援1小時音訊最快5分鐘出稿。不論從識別準確率上還是轉寫速度上,都不遜色於市面上主流的AI轉寫軟體。

因為口語和書面語言之間天然的差異,在機器語音轉寫時,人們常常會遇到一些細節上的問題:例如無法區分說話物件、文字語序混亂不符合閱讀習慣、標點錯誤等等。導致即使由機器完成了轉寫,往往還需要人工進行整理,這種情況顯然是非常低效的。

而搜狗基於輸入法產品中使用者使用習慣的資料,對於文字內容的處理捻熟於心,透過智慧輔助編輯向使用者提供智慧糾錯、智慧文字順滑、標點預測等等功能,再進一步提升錄音筆工作效率。

另一方面是成長賦能。

輸入法產品為搜狗帶來的,不僅僅是技術上的累積,還有龐大的流量池。目前搜狗輸入法APP端擁有超過4.5億的日活使用者,PC端更是佔據99%的市場份額。現如今這一龐大的流量池已經與搜狗的智慧轉寫服務打通,未來應用這一服務的使用者將會越來越多。

這意味著搜狗開放給錄音筆在語音識別、智慧糾錯等等方面的能力會在反覆應用中不斷錘鍊提升,層出不斷的新俚語、新術語也能透過雲端同步其中,錄音筆產品技術能力的成長體系得到了保障,長遠來看其工具價值呈現出了一種穩步上升的狀態。

捭闔之術:比產品更廣闊的產業改造空間

和縱橫術同樣重要的,是搜狗的“捭闔術”——AI創新聯盟的成立。

在上面的縱橫術中,我們看到的是透過AI賦能,提升錄音筆工作效率,重塑其工具價值,讓錄音筆擁有了重新“奪回”自己市場的可能。但對於這一堪稱“歷史悠久”的產業來說,除了和手機進行領地爭奪,還是否能產生其他火花?

答案當然是肯定的。

比如,錄音筆產業時時刻刻都流入著大量的語音資料,其中囊括著不同語言、不同垂直領域,這些珍貴的資料如果能夠被留存利用起來,可以發掘出巨大的價值。

又比如,錄音筆一直依靠單一的硬體盈利模式,現如今隨著技術能力的提升,降低硬體入手門檻,透過軟體進行盈利,或者打造移動端軟體開拓廣告收入等等,都是錄音筆產業開拓收入來源的可能。

更重要的,是AI創新聯盟中“AI”一詞的存在。搜狗作為AI企業,和錄音筆這樣的硬體產業能碰撞出的絕不僅僅是幾款新產品。錄音筆產業所掌握的收音經驗與技術、供應鏈上累積的優勢,與搜狗的AI能力相結合,給予整體行業創新刺激所帶來的收益,將遠超我們的想象。

由此可見,搜狗聯合錄音筆產業的縱橫捭闔,不僅僅重新啟用了讓一款不適應當下應用場景的硬體產品,更是給予了整個產業無限的改造空間與可能,讓他們更好的跟上技術大潮。

縱橫捭闔之術,並非是為錄音筆一個產業打造,而是搜狗面對產業世界的一種態度。

進入2018年以來,工業AI、產業網際網路等等詞彙層出不窮,其概念都是相似的——用AI技術更好的改造傳統行業。而搜狗也找到了自己的“兵法”,從技術的輸入到對合作夥伴的捏合,都在為產業整體技術升級的大工程添磚加瓦。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2655464/,如需轉載,請註明出處,否則將追究法律責任。

相關文章