一家道系AI公司的非典型邏輯

naojiti發表於2019-05-28

AI創業到底怎麼啟動?這是個有趣的問題。

隨著基於AI而崛起的創業公司越來越多。大家都開始有這樣一個疑問:AI公司,是不是隻能有一個模型?

一般來說,我們知道的AI公司,基本公式就是在語音、影像、晶片三者中選一條路、開發演算法、打國際比賽獲得名次、得到大量B端訂單、成為獨角獸。似乎芸芸AI莫不如此。

是否有可能,AI公司可以換一個發展邏輯?一點點織成不一樣的發展軌跡呢?不久前,我在杭州探訪了一家名為Rokid的AI公司。它在剛剛所說的“AI創業公式”面前,可謂一家絕對的另類。

一家道系AI公司的非典型邏輯

不少朋友知道這家以“若琪”音響而聞名的公司,而且往往是因為其產品的設計感非常出色。可是如果回到AI層面,我們卻能發現這家公司在幾個基本層面是“反常識”的。

比如說:

1、在音響產品恨不得免費的時候,他們的音響卻並不便宜。

2、很少聽說過一家AI創業公司,不僅做產品,做B端解決方案,甚至連晶片和OS都一起做的。

3、在AR眼鏡一片蕭條下,似乎以音響為主的Rokid卻做了AR眼鏡。

究竟是這家公司故意搞噱頭,還是確實有某種邏輯支撐起了這些“非典型”舉動?在探訪Rokid之後,我的感受是在大家都在熱絡討論“佛系公司”的時候,Rokid的思考方式卻是道系的。它在AI變局中立足的核心要義,是《莊子》所說的“外化而內不化”。

為什麼這麼說?我們需要從Rokid的誕生開始說起。

輕擁AI,於深度學習的晨曦

2014年,AI在中國還只是媒體偶爾會討論的概念,在社交網路上出現,基本都來自科幻電影。

然而如果回溯整個AI發展史,卻會發現這個時間節點,是深度學習技術真正爆發出力量的那個剎那。當時剛剛走出阿里,想要再次創業的Misa祝銘明,帶領夥伴在杭州成立了Rokid。從創業伊始,Rokid的目標就定位於要做人機互動。

為什麼確立這條賽道?同Misa一起創業、現任Rokid副總裁的向文傑回憶說,當時最主要的動力,是看到了深度學習的廣闊想象力。

一家道系AI公司的非典型邏輯

對於技術從業者來說,AI在當時雖然還是個冷門行業,但並不是一個全新議題。但在深度學習出現前,AI在理論到現實中的轉化能力始終不盡如人意。然而隨著深度學習技術體系的確認,並且在機器翻譯、語音識別、語義理解等幾個領域超乎預料的好用,Rokid的創始班底開始看到,AI這東西真的有明天。

然而以深度學習為代表的新一輪AI技術,最能改變的是什麼呢?在Misa等人看來,無論是語言還是視覺,最根本被改變的必然是人機互動形態。這是AI的終局,也是Rokid的無限目標。

隨後,Rokid嘗試從語音互動為起點,逐步探索人機互動入口的硬體產品形態。回頭看5年前,AI在當時的狀態並不被市場看好。但是真正懂得的人,卻會發現其終點是那麼和光同塵。這大概就是道家所說“守無明”的狀態,每一家長線發展的公司,都會有這樣一段旅程。

音響的錘鍊與匠致

接下來,以人機互動為目標的Rokid在外界看來產品形態同樣是做音響。然而在推出第一款產品到今天的幾年間,Rokid與大多數AI音響公司,實質上已經走向了基礎理念影響下的岔路。

雖然成立於2014年,但直到2016年他們才推出了第一款產品智慧家居機器人Rokid Alien。這款能投屏、能攝像、能語音互動的機器人,雖然售價達到5000+,但在今天看來也依舊是非常新銳的產品方案。而後2017年,Rokid又推出了高階音響Rokid Pebble,這款產品斬獲了智慧硬體和工業設計類的許多大獎,也是眾多使用者認識 Rokid的起點。

2018年,Rokid終於迎來了新品的“爆發期”,推出了Rokid Panda、Rokid Me、Rokid Mini三款語音互動產品。

一家道系AI公司的非典型邏輯

(Rokid第一代智慧音響Alien)

然而即使是這一年的三款產品,數量也遠低於其他AI音響公司的釋出頻率。並且在AI音響已經恨不得免費的時候,Rokid的新一代產品“Rokid Me”依舊售價達到了799元。而且與同行努力重新整理品的戰略不同,Rokid令人“大跌眼鏡”地先後釋出了AR眼鏡、語音晶片和OS系統。

回到音響的差異化上,Rokid的基礎面貌是貴和少,這與業內同行的成本戰、補貼戰、新品數量戰截然不同。這或許就是戰略目標推演下來的行動分化——既然Rokid的目標是做人機互動,那麼這一階段他們的目標就不是最快速佔領市場,而是要把語言互動做精緻、做完整,讓產品成為真正使用者購買後時時想要觸發的AI入口,而不是一個嚐鮮期的擺設。

於是,Rokid做了完整的喚醒、互動與語義理解解決方案,首創了雙音節喚醒詞。並且在工業設計和產品工程能力上,與業界平均水準拉開了清晰的分界線——這是讓音響自證AI人機互動存在價值的階段。

與此同時,精雕細琢的音響產品,還為Rokid鍛造了三個它證:

1、不斷提升的機械設計和工程能力,為品牌輸出B端解決方案建立了差異化優勢。

2、語音互動體驗的完整性和部署能力,讓Rokid可以適配廣闊的音響解決方案需求。

3、在不同目標客戶群中建立了市場口碑,為下一階段開啟人機互動升級與融合提供了基礎。

至此,我們可以嘗試回答第一個問題,雖然Rokid的硬體產品看起來是小眾的,但是如果它走補貼和廉價路線,這三個根本能力也就蕩然無存。

不急不徐地積累了產品,雖然挺慢但是沒有浪費產業資源,並且逐漸完善了人才與技術生態。在高速變化的AI產業中,足夠的積累,是能談論下一步的底牌。

而下一步的高速發展視窗,對於Rokid來說,其實出現於B端市場。

B端市場的風與海

在語音硬體發展的歷史上看,2018年可以看作一個關鍵節點。

對行業來說,經歷了瘋狂的“智障音響”淘洗之後,市場還是轉向接受高品質、高可用性的音響產品。與此同時,隨著AIoT概念的開啟,不少廠商都意識到音響產品作為家庭AI場景中樞、音訊內容輸出口,以及生活服務接駁點的價值。

所以雖然低成本音響肆虐於2017,但到2018以後,音響產品整體卻未冷反熱,良幣開始呈現出更高的市場接受度。

藉助這個節點,在自有硬體市場建立了基礎的Rokid,開始建立和驗證了一個2C2B的邏輯。這個邏輯的要點,用道家的理論說,叫做“難易相形”。由於Rokid已經在C端硬體領域建立起了足夠“難”的技術與工程壁壘,此時開啟B端解決方案市場就會順勢而為,從容停當。

於是我們看到,大量廠商開始選擇Rokid作為自身音響產品的合作伙伴,使用其解決方案來構築自己的音響產品。

比如說,在今年3月,360推出了自己的音響產品。其背後從前期方案設計、定製開發,到量產期間的品質把控,Rokid都提供了全程的技術支援。Rokid不僅為其提供了雙喚醒詞的定製化功能,還為其定製了聲紋識別功能,讓家人擁有“聲音密碼”。

一家道系AI公司的非典型邏輯

(Rokid成為360語音戰略合作伙伴)

據瞭解,僅僅在2019 第一季度,Rokid 的語音技術已先後服務於塗鴉、榮事達、哈曼卡頓和 360 等多個廠商的音響新品,TCL、創維小湃的電視和兒童故事機產品,其合作品牌已達到100家以上。

而在在音響之戰的下半場,另一個價值獨特的B端市場來自三大運營商。由於運營商擁有流量、使用者基數、內容等多種優勢,並且家庭AI已經成為了運營商目前注意的進攻方向,因此其推出AI音響的市場願望也就在今天逐步清晰。

然而客觀上來說,運營商在技術能力和AI人才儲備上顯然是較AI企業相對落後的。這種情況下,運營商的AI音響需求,也就成為了AI語音互動供應商新的藍海。

這也是Rokid抓住的一縷風。今年4月,Rokid 與聯通沃音樂達成戰略合作。聯通沃音樂還發布了由 Rokid 提供全鏈路語音方案的新款智慧音響 A2。而此前中國移動已經推出了由Rokid提供語音解決方案的音響產品“和家小荷”;去年,四川電信也與Rokid達成了深度合作。至此,三大運營商都選擇了Rokid作為音響產品解決方案提供商,這可是絕對的罕見。

究其原因,Rokid進入這一市場,所依賴的核心優勢叫做“完整”。

一家道系AI公司的非典型邏輯

(Rokid與聯通沃音樂戰略合作簽約儀式)

這包括從軟體到硬體層的佈局完整,也包括從晶片到OS再到演算法層的全棧部署完整性,還包括整個Home場景的完整性。就企業使用者而言,Rokid一方面提供了最大的解決方案可選擇性,另一方面也讓使用者可以最大限度解除AI門檻。從核心演算法,到工程化能力,第三方接入體驗,以及內容、技能、IoT接入的能力,Rokid提供了一個非常完整且高價效比的方案,企業使用者不需要太多修改就打造更好的AI語音硬體。

非常複雜的企業市場,Rokid能夠最大程度進行相容的核心優勢在哪裡?其根本原因或許就在於其“慢”的C端技術能力積累,變成了“快”的B端能力升級。

這不僅是關於技術和能力的積累,也包括組織架構對B端市場的準備和適應。Rokid就進行了技術中臺化,打造中重中臺、小前端的架構。如此可以靈活適應B端市場的高定製化需求。從開始進入B端市場到現在,Rokid已經將產品整合週期從6個月縮短了3個月。

在B端市場進一步開啟的情況下,Rokid也同時迎來了新的變化。晶片、OS、AR眼鏡,這些絕對不像一家AI語音公司應該具備的產品,接二連三“生長”了出來。

從晶片到OS,順勢而為的創造與突破

B端市場的旺盛生長,以及Rokid站立其中的邏輯,也可以反過來回答另一個問題:為什麼Rokid要做晶片這麼重的東西?

原三星半導體(中國)研究所長、在2018年4月入職Rokid、出任副總裁負責基礎平臺相關業務的周軍博士給我的答案,是在需要的時候,自然而然就選擇去做了這些。

以Rokid推出的語音晶片KAMINO 18為例。在音響產品中,國內高階音響產品一般是使用通用CPU進行計算。但問題是CPU並不適應針對性的語音計算,容易造成大量算力浪費和高昂成本。而一些物聯網晶片,卻無法支撐複雜的語音互動,尤其是音響+通話的需求。這種情況下,Rokid看到了需求和機會,於是在自身晶片人才團隊的積累下,基於產業合作打造了自己的AI 晶片 KAMINO18。而其對B端市場的直接影響在於,給客戶提供了更低功耗、低成本的晶片解決方案,完善了全棧能力。

一家道系AI公司的非典型邏輯

(Rokid自研AI專用晶片KAMINO 18)

而YodaOS也是如此,由於AI語音軟體在硬體上部署缺乏平臺化介面,企業使用者和開發者想要定義自己的語音互動解決方案十分不便。這個痛點的存在,讓Rokid開發了YodaOS。這樣B端合作者將可以更自由靈活定義自身的產品形態,而Rokid也收穫了自己的開發生態基礎。

做好人才與平臺準備,隨時發現需求與變化,積極進行回應,是Rokid做出這麼多看似奇特產品的基本邏輯。而這樣是思考方式也影響了其接下來的產品走向——視覺。

去年的釋出會上,Rokid拿出了研發和投入已久的 AR眼鏡產品Rokid Glass,這在今天的行業狀況來說是很奇怪的。然而出於對人機互動的探索來思考,那麼AR眼鏡就處在接下來“自然而然”的產品地位。另一方面,雖然AR眼鏡今天依舊處在初級階段,然而其需要路徑卻是清晰的,當風口真正開啟時,已經具備產品能力和技術優勢的Rokid希望自己處在更有利的位置。

追尋基本常識,是我們看到Rokid拿出全棧產品的邏輯支撐。這個邏輯也挺“道家”的,所謂自然而然,應有則有。

道系AI公司的邏輯

向文傑認為,Rokid作為一家AI創業公司,最大的體會是要“站在終局,保持變化”。

站在終局的不動,與保持變化的隨時動,這看似矛盾的概念,正好構成了Rokid很有道系味道的產業邏輯。

在他們看來,是AI將要改變人類的互動方式,其中蘊藏著巨大的機會,這是需要內不化的東西。而外部隨時出現的技術變化、產業變化,則是一個如流水般的環境結構,必須實時外化。比如說運營商的音響產品解決方案需求,這就是一個其實並不小但卻是在激盪的產業效率裡被突然擠壓出來的市場機遇。

而只有內固外化,才能保持始終的方向和對產業需求的實時捕捉, 不斷夯實看到的東西,見縫插針組織自己的技術壁壘和產業生態。

一家道系AI公司的非典型邏輯

(Rokid Glass)

Rokid與AI獨角獸和大公司的區別也在於此。大公司的團隊龐大,捕捉一線實時機遇的效率某種程度上來說不如小公司,同時面臨營收和市場的巨大壓力,大公司和獨角獸也很難保持對一件事的專注不動搖。

從Rokid背後,我們可以看到一個關於AI創業方案的辯論:一般意義上我們認識中的AI創業公司,都希望自己變成石頭。在某一個演算法、某一個行業快速完成卡位,然後不斷擴充石頭的邊緣,堵在那裡動也不動。然而在AI產業升級不斷進行戰略進化的時候,清晰的某一領域AI壁壘是很容易被大公司舉起重資源衝破的。而Rokid則讓我們看到了,AI創業可以不像一塊石頭,而是像水。核心的流向不變,不斷在幾個水域裡勾勒自己的渠脈,最終它的產業價值將是彈性與自迴圈的。

是之謂,道法自然。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2645981/,如需轉載,請註明出處,否則將追究法律責任。

相關文章