匹馬搶三關:訊飛翻譯機3.0的破障之戰

naojiti發表於2019-05-22

技術和市場的兩股氣旋,正在催促翻譯機加速奔跑。

根據中國旅遊研究院統計,2018年全年中國出境遊旅客達到1.4億人次,比2017上漲1100萬,同比增幅達到了13.5%。時至今日,我們已經可以確鑿地說,作為全世界出境遊第一人次與消費額大國,“去那麼大的世界看看”已經成為了中國人的剛需。

與此同時,AI技術不斷進步正在倒逼消費級硬體做出回應。除了音響之外,翻譯機基本已經坐穩了AI硬體的第二把交椅。

然而客觀來說,今天的翻譯機市場並不是已臻完善。雖然市場的不斷開啟,正在讓越來越多消費者意識到翻譯機這個選擇。然而與1.4億出境人次的巨大旅遊市場相比,翻譯機的滲透率依然有很大提高空間。

在翻譯機剛剛站穩腳跟的這個檔口,或許核心玩家必須回答這樣一個問題:怎麼才能把翻譯機做得更符合真實需要?讓使用者從“可以試試翻譯機”,變成“喜愛翻譯機”?

5月21日,科大訊飛在上海世博中心召開了“你的世界,因A.I.而能”為主題的2019新品釋出會。不出所料,其中重磅的年度產品是訊飛翻譯機3.0。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

如果說,訊飛翻譯機的前兩代,完成了從無到有的“陣地戰”。那麼3.0時代的訊飛翻譯機,打的則是一場闖關拔寨的“攻堅戰”。

語障:AI翻譯情景中的現實難題

客觀來說,今天的AI機器翻譯技術總體上已經相當成熟了。至少在英漢翻譯維度上,旅遊場景的簡單翻譯已經不是難題。

那麼為什麼很多需要外語表達能力的中國遊客,依然不會在旅行中選擇翻譯機呢?

很大一部分原因在於,旅行和商務場景裡,翻譯機面臨的窘境往往不來自簡單的英漢互譯的考核成績,而是來自充滿不確定性的現實因素。

比如在現實生活中,尤其是旅途中的翻譯需求,往往發生的短促而急迫。這時眾多因素都可能成為干擾,比如使用者的口音、周圍嘈雜的環境、突然失靈的網路,等等等等。而翻譯機面對的市場需求,恰恰是一個“木桶理論”:不管因為任何原因,只要失效一次,使用者就有可能產生逆反心理。一旦連續失靈,使用者就會產生再也不用翻譯機的想法。

這些難題,是在理想翻譯環境中都不存在的——也就是口譯人員經常要面對的“語障”現象。

而AI翻譯能力從理想走入現實,需要將這些現實短板一一剔除。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

在剛剛釋出的訊飛翻譯機3.0中,我們可以看到一系列針對現實強應用性的升級。其中最重要的因素在於,它從軟硬體結合的角度,完成了三場關鍵戰役的勝利。

眾聲喧譁:現實翻譯場景中的環境之戰

現實應用翻譯裝置的第一個難題,就是環境中的不確定因素經常導致翻譯失靈。其中比較具有代表性的問題,一個是翻譯環境可能會有噪聲汙染,翻譯機很難聽清。再一個是沒有網路,翻譯機會失靈。最典型的環境,就是在飛機上用翻譯機與空乘人員溝通。

攻破這個環節關卡,必須要依靠硬體的突破。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

在訊飛翻譯機3.0中,搭載了訊飛智慧翻譯核心、驍龍八核處理器和全球部署CDN。由此,訊飛翻譯機3.0的翻譯速度能夠達到“0.5秒閃譯”,有效避免了翻譯速度過慢帶來的尷尬。另一方面,通過“四麥降噪”技術、“雙揚聲器”裝置和“端到端”翻譯,訊飛翻譯機3.0能夠大幅降低噪音干擾。

面對另一個“環境殺手”——無網君,訊飛翻譯機3.0搭載了新一代離線核心,包括新一代離線語音識別引擎、離線翻譯引擎。藉助大功率處理器,離線語音識別訓練模型規模擴大了5倍,中英文識別率超95%;翻譯模型容量增加105%,涵蓋詞庫規模擴大1倍。

這些翻譯機的“荒野求生”技能,讓其存在價值大大提升。畢竟翻譯機的另一重邏輯在於,其在特殊情況能夠發生一次作用,往往就意味著有備無患。而特殊情況,往往是在突發、無網和混亂情況下。

此外,喜聞樂見的拍照翻譯,在訊飛3.0版本里也被極大增強。並且在硬體端配備了圖文專業調校攝像頭、高清視網膜螢幕、閃光燈,確保拍照翻譯在各種光線環境下繼續工作。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

可以看出,在硬體能力上的增強可以看作此次訊飛翻譯機升級的一條主幹道。當我們認為AI翻譯是一個純軟體工程和演算法能力時,往往會忽略在消費者體驗面前,軟硬體能力從來是不可偏廢的。

好在這條路已經被開啟。有理由相信,計算能力、通訊能力、收聲能力與拍照能力的綜合比較,會將翻譯機真正推向多元化市場。翻譯機正在過渡為智慧手機相類似的綜合硬體,這或許也是科大訊飛未來的機會。

術業有道:開啟深度體驗的行業之戰

目前翻譯機的市場受眾,主要集中在旅遊場景中。其面向人群主要是有機會出國遊,渴望自由行體驗,但又缺乏足夠的當地語言交流能力。

然而事實上,翻譯機還有進一步開啟市場的可能:在商務、遊學、談判等場景中,具備專業能力的翻譯機市場,其實是一片廣闊的藍海。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

這就需要翻譯能力從基礎的旅行工具,走向專業場景。這也是訊飛3.0攻克的另一個語言壁壘:專業翻譯的可能與實踐。

繼2018年12月首發行業A.I.翻譯功能後,訊飛翻譯機3.0增加了新的行業AI翻譯場景,已經覆蓋了醫療、外貿、體育、金融、能源、計算機、法律等七大行業。

運用行業AI翻譯能力,使用者可以改變很多不可能使用機器翻譯的場景。比如SUV是車型,這個誰都知道,然而在醫療場景裡,它卻是標準化攝取值的意思。只有基於龐大的行業語料資料進行AI訓練,這樣的垂直領域機器翻譯才有可能成真。

而這一關口的突破,意味著新市場正在向訊飛翻譯機開啟,同時也為普通人提供了更多與世界相遇的可能。

他山之石:貼近真實需求的方言之戰

在翻譯機使用痛點中,還有一個重要因素是使用者可能帶中文方言,而對話物件也可能帶英文方言。

事實上,這是一個非常大概率發生的事件。翻譯機的目標使用者,往往是境外旅遊的中老年人,他們有方言口音是非常常見的事情。而在國外旅行時,我們往往會發現當地的商家與服務人員,基本都操著濃重有口音的英語。二者一結合,也就讓傳統意義上的翻譯機價值大打折扣。

由此可見,翻譯機想要更加貼近真實需求,就必須利用AI技術,提供更具彈性的方言理解與輸出能力。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

我們知道,方言識別與翻譯一直都是科大訊飛的技術優勢。在訊飛翻譯機3.0中,獨家支援了中文方言翻譯,包括粵語、東北話、河南話、四川話以及有口音的普通話,另外還支援普通話和粵語互譯功能,維吾爾語和普通話互譯功能,藏語和普通話互譯功能。

而在外語方言上,訊飛翻譯機3.0也一次推了大招處理。支援英語 (加拿大) 英語 (英國)英語 (紐西蘭) 英語 (印度)英語 (澳大利亞) 法語 (加拿大)孟加拉語 (印度)等方言的翻譯。

匹馬搶三關:訊飛翻譯機3.0的破障之戰

不難發現的是,進入3.0時代的訊飛翻譯機,走向的是貼合真實場景、真實需求之路。從考卷上走下來的訊飛,開始向現實世界中的翻譯難關發起猛攻。

三關之後,當然還有很長的路要走。只要語言的巴別塔還在,攀塔者永不能停歇。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2645152/,如需轉載,請註明出處,否則將追究法律責任。

相關文章