引領前瞻創新、顛覆舊有認知 : 百度輸入法的AI新賽道競逐之路

曾響鈴發表於2019-01-17

大多數人看來已經十分成熟的網際網路產品——輸入法,躁動還在繼續。

1月16日,百度輸入法搞了一場名為“AI·新輸入 全感官輸入2.0”的釋出會,釋出了其宣稱為“國內首款真正意義上的AI輸入法”的百度輸入法AI探索版,百度高階副總裁王海峰表示,“百度輸入法將扮演好溝通橋樑的重要角色,讓人機互動進入一個全新的階段”。

該輸入法是一款預設輸入方式為全語音輸入,並支援表情、肢體等進行所謂“全感官”輸入的輸入產品。看起來,百度想要憑藉一貫的AI技術優勢來獲得輸入法市場的突破,而用“溝通橋樑”來定義,也說明百度嘗試在“輸入”二字上進行新的玩法探索。

事實上,AI與輸入法的結合並非什麼新鮮事,鬧出過“6億使用者”笑話(吹牛被識破)的科大訊飛就經常把AI技術掛在嘴邊,去年12月還推出了由所謂“訊飛超腦計劃”加持的訊飛輸入法。

被外界認為優化空間越來越小的輸入法產品,開始從AI上找突破的機會,也惹得各路豪強爭相競逐。而AI的介入改變的可能不只有“輸入”,或還有整個“輸入法”的固有認知。

1.jpg

成熟的輸入法市場,使用者需求帶來革新動力

AI被深度應用到輸入法,與市場需求劇烈變化而目前多數產品形態仍然老舊有直接關係。

首先,是主體移動網際網路人群在語言輸入上有典型“混合化”需求:

不同漢語語系的基本的語法不斷融合,如北方語系“你先走”,到了廣東、香港南方語系,就變成“你走先”,如果是華人,則還有“你先走先”這樣的混合用法;

與此同時,包括四川話、長沙話、東北話等特色地區方言逐漸得到大眾認可,jio(腳)之類的語音開始混用;

部分走向精英化,或者出於特定社交目的的人群,中英夾雜成為常態,“我不care”、 “Emma,我覺得的這個idea真的很amazing”,諸如此類在輸入情境中出現得越來越多。

其次,是移動網際網路人群進一步下沉,讓產生輸入的“需求錯配”。

張小龍說55歲以上的中老年人在微信使用者中佔據了可觀的比例,事實上,包括微信在內的需要大量使用輸入法的移動網際網路產品向低線城市、農村的中老年滲透是不爭的事實,這些使用者一方面不懂常規輸入操作,另一方面作為“新網民”又對輸入需求更為迫切,需求產生了錯配。不巧的是,這些人當中,方言習慣又佔了絕大多數。

最後,就是所有網際網路產品都在津津樂道的95後、00後新新人類,他們隨著時間的推進逐漸佔據移動網際網路主舞臺,不喜歡陳舊的事物、總是在追求新奇體驗。

不是說“老產品”輸入法就一定不得他們喜歡,只不過,抓住這些新新人類需求容易形成新的競爭優勢。

2.jpg

帶來多樣性與創新性,AI技術成輸入法“香餑餑”

總的來看,變化了的“輸入”需求並不一定都需要AI來解決,但AI無疑最具備多樣性與創新性可能。

如開篇所言,靠技術發家的科大訊飛對輸入法AI應用最為積極,2018年6月其推出的輸入法版本號稱可針對嘈雜環境進行智慧降噪,在主動轉換後能支援多種方言輸入,且可以中英混合識別。此外,還推出所謂“同音字詞智慧分辨”,可以判斷“他”、”她“、”他“等。

作為輸入法領域佔據先發優勢的玩家,搜狗也不忘在AI上下功夫。CEO王小川2018年開年強調AI賦能輸入法與搜尋,要“通過AI技術大力發展語音、對話、翻譯”,隨後,搜狗AI技術的重心放到了可以直接帶來營收的翻譯機硬體上,翻譯寶Pro的42種語言實時互譯,在輸入端加入了語音識別支援。

而以AI技術立身的百度自然也不會放棄用AI獲取輸入法競爭優勢的機會。只不過,百度的玩法有些不同,這次釋出的“AI探索版”乾脆把預設輸入方式改成了語音輸入,表情、肢體的全感官輸入很明顯是要把AI當做“主業”來搞,而不只是提升準確性的輔助技術。

百度的做法,與AI技術的屬性密切相關。原本AI就是要讀懂人類的語言、識別人類的命令並做出相應的反饋,而AI獲得資訊的方式有很多種,它們都可以看作是“輸入”,使用者原本也有很多對移動終端的“輸入”需求,而不只是文字資訊。

例如,早期的輸入法以字元輸入為主(使用者敲鍵盤,如同碼程式碼),到後來語音輸入大行其道(使用者只需要用口說),現在,百度推出的輸入情境下的拍立活(讓使用者通過自己的動作“驅動”對方做出相同表情)、AR表情(為使用者自拍新增背景場景)、凌空手寫等AI功能,其實就是沿襲AI技術本身的特性,在輸入的方式上進行了某種“維度”提升,使用者可以照照自己、照照某些東西就可以進行“輸入”。

全感官輸入的意義,無非是讓使用者通過“輸入法”輸入的資訊,在文字之外還有更多選擇,從這個意義上說,AI既是輸入法們提升產品多樣性和創新性的技術手段,反過來它本身的屬性也給出了輸入法打破舊有“文字資訊”桎梏的路徑。

也由此,百度輸入法這個所謂“AI探索版”,先不論實質內容是否有價值,至少在模式上給出了AI輸入法樣板。

3.jpg

除了創新,輸入法AI競爭還需要抓住使用者需求的“細節”

輸入法是不太起眼卻又讓使用者離不開的“小產品”,由此,應用AI技術進行競爭除了理念與方向,在具體操作上對細節的關注可能更能俘獲使用者。

1、準確性提升是永恆的主題

如同手機跑分一樣,準確性不論何時都是檢驗輸入法能力的硬指標。時至今日,輸入法的準確性提升已經是“高位榨取”的過程,變得越來越極致也越來越難。

例如,訊飛喜好宣傳其語音輸入的準確率,據稱已經提高到98%,並且1分鐘可以輸入400字,搜狗也有類似的準確性宣傳。而百度此次之所以敢推出全語音輸入,除了使用者需求,更在於其所說的“領先業界的語音技術”。

百度輸入法釋出了線上語音的“流式截斷多層注意力建模”(SMLTA)技術,按其說法,是“世界上首次實現了區域性注意力建模識別精度超過全域性注意力模型”,以及“世界上第一次大規模部署線上語音互動注意力模型”。該技術可以解決傳統模型存在的“時延性”問題,百度方面宣稱其“將線上語音識別精度提升了15%,超越行業最高水平15%”。

2、一邊是5G時代到來,一邊更應關注“沒網”的需求

刷短視訊、聊微信、打遊戲、購物……這些地鐵族的標配,其實隱含了輸入法的另一個需求:如何解決旺盛的離線識別需求。

5G時代的腳步越來越近,但列車、電梯、隧道、高密度人群(例如春運的火車站)環境下,網慢、無網給語音輸入提出了更嚴峻的挑戰。而越是斷網的場景,使用者對輸入法的需求其實越高,在寫字樓網路好的場景其使用頻率反而降低(工作等原因)。

由此,AI語音離線識別近來成為輸入法產品爭相打造的技術。搜狗就宣稱其可以實現4國語言離線翻譯,而百度則盯住Deep Peak 2系統進行優化嘗試解決使用者多元輸入場景的需求。目前,在地鐵、電梯、隧道或人流密集等離線場景中,百度輸入法仍然可實現精準的語音輸入,官方稱“高於行業平均水平35%”,從這次釋出會的一段各輸入法即興離線語音識別PK來看,百度輸入法的確佔優。

4.jpg

3、只有一個產品,卻必須滿足極端多樣化的需求

誠如前文所言,在中文環境下,輸入法不得不面臨多樣化的輸入需求,方言、英文、不同語法……而輸入法不可能為各地、各使用者群分別開發,由此,如何更好地同時相容各語言,成為輸入法“體驗”的重要環節。

例如,方言識別已經是多數輸入法的“標配”,然而,由於技術的限制,使用者往往還需要一個“進入”方言的切換動作,一方面這與網際網路儘量簡潔的產品思維相悖,另一方面對很多對電子產品不熟的下沉使用者而言形成了天然阻隔。

5.jpg

這給了百度輸入法機會,其“方言與方言、方言與普通話的混合語音輸入”技術,目前實現了無縫切換,使用者可實現“自由說”。與此類似地,中英文夾雜亦可來回切換。目前為止,百度輸入法應當是市面上唯一實現了高精度中英文混合語音輸入、方言免切換語音輸入的輸入法產品。

AI技術PK後,輸入法還有你想象不到的“新機會”

客觀地說,在AI技術浪潮下,上述技術革新帶來的細節體驗,相信各大輸入法一定會盡快補齊,畢竟產品目標擺在那裡,去實現就行了。

然而,從這次釋出會來看,百度輸入法或還“留了一手”,AI輸入法樣板的聚焦點可能不只有AI,百度還意圖顛覆關於輸入法的舊有認知,為輸入法應用開啟新的應用場景與商業可能。

百度輸入法AI探索版新互動、新表達、新探索三大產品主題來看,其試圖結合使用者需求、網際網路產品理念、AI技術趨勢等大環境,顛覆輸入法三個固有認知:

1、"輸入法只是C端產品“

輸入法當然是給普通使用者使用的,它是最成功、最普及的C端產品之一。不過,視訊維度的資訊輸入可能為輸入法開啟了新的商業空間大門。

百度輸入法AI探索版的拍立活、秀場,需要平臺提供特定的元素配合。百度海外輸入法曾經與超級IP《變形金剛》系列首部獨立電影《大黃蜂》聯手推出“大黃蜂”系列主題貼圖和AR表情,此外,還與Hello Kitty、小黃鴨、小王子、格林奇等全球100餘個知名IP達成合作,推出IP皮膚和表情。

在此基礎上,百度輸入法針對海外使用者還設計了本地網紅合作推廣等定製化傳播,而這,可能就是搜狗輸入法等產品一直夢寐以求的變現路徑,有了B端合作的可能。

2、"輸入法是工具產品“

用完就扔,召之即來揮之即去,輸入法做個最普及的“工具產品”倒也沒什麼,但是偏偏全感官輸入給輸入法撕開了一個貼合當前移動網際網路內容需求的口子。

不久前,微信力推朋友圈的小視訊功能,使用者可即時拍攝視訊分享。很明顯,社交+泛娛樂(尤其是短視訊)成為各家都在爭搶的潛力領域,頭條系、微信都試圖往對方領域滲透。

而“全感官輸入”一個討巧的地方就在於,類似AR這種應用,讓一對一聊天和群聊環境下,使用者可以直接發出類似小視訊的內容進行共享,實現小視訊社交的目的,這就是大佬們都在追求的社交與視訊融合。

不過,目前來看,AR應用只處在增強輸入體驗階段,社交泛娛樂產品只是未來的想象空間。

3、"輸入法只能用來PC、手機輸入“

最早的漢字輸入還需要專門的“漢卡”硬體,到後來PC時代開始進入軟體化,移動網際網路時代更是帶來多種便捷輸入體驗。

現在,這一程式還在繼續,輸入法或將有脫離於PC、手機的可能。

百度輸入法AI探索版的“新探索”推出了凌空手寫,用手指在攝像頭取景範圍內的空中手寫,輸入法即可識別並生成文字。乍看這是利用手機攝像頭和AI技術的一種新奇玩法,而事實上,這意味著輸入法有了脫離PC和手機的機會,比如,在目前已有的案例中,百度輸入法凌空手寫技術已經在小尋手錶、小天才電話手錶上得到應用。

6.jpg

這意味著,凌空手寫或類似的AI技術,有可能將輸入法可匯入到更多智慧終端當中,為輸入法開啟完全不一樣的場景新天地,同時推動智慧硬體的體驗更新。

拭目以待吧。

相關文章