詳解網易AI佈局,三大AI產品矩陣浮出水面

weixin_33766168發表於2018-10-03

這兩年,各大網際網路公司都在緊鑼密鼓地召開AI大會、AI開發者大會,網易卻一直沒有行動。9月26日,在中秋假期與國慶假期接壤的間隙,網易召開了一場小型媒體workshop,雷鋒網得以與人工智慧事業部總經理李曉燕深入交流,一窺網易AI佈局。

TB1pzLMe6TpK1RjSZKPXXa3UpXa.png

人工智慧事業部總經理李曉燕

網易目前有三大AI產品矩陣,首先是AR業務線,包括網易洞見、網易影見;其次是對話AI業務線,有自己的硬體產品“網易三音雲音響”;網易也建立了AI平臺業務線,包括網易AI平臺、網易見外,與BAT的全開放式AI平臺不同,網易還做深度定製AI專案。

網易人工智慧歷程

李曉燕是網易人工智慧元老級人物。2009年到2011年,李曉燕在浙江大學攻讀計算機博士生期間開始在網易實習,正式加入網易後組建了多媒體技術部,當時第一批成員有6個人。

2012年,多媒體部門開拓了計算機視覺、人臉識別、人臉認證、影象美化等技術;

2013年擴充深度學習、語音識別、聽歌識曲、數字水印、視訊編輯、人臉美化等技術;

2014年深度學習演算法全面升級,影象識別和檢索技術大幅提升,開始服務網易遊戲、音樂、易信等部門;

2015年OCR、發音測試、影象過濾、人臉SDK等技術升級,擴張服務網易郵箱、有道詞典/雲筆記等;

2016年,擴增實境、人工智慧系統產品化,SLAM 2D/3D技術成熟,網易洞見、網易影見、網易見外、網易波特、AI平臺智慧客服服務全面上線;

2017年,成立網易AI事業部、浙江省擴增實境與智慧互動工程技術研究中心;

2018年,全面探索商業化之路,網易三音雲音響上市、AI平臺對外開放。

雖然網易佈局AI已久,但是前幾年AI還沒有因深度學習而突飛猛進,無法上升到戰略層面。節點性的事件發生在2017年,網易AI團隊升級為人工智慧事業部,開始真正為集團其他業務賦能。網易也劃分出AI戰略的三條線:AI平臺、基於計算機視覺的網易AR、語音識別和NLP方向上的語音互動業務。

其實在2017年,BAT等已經全面確定了AI戰略,也已經鑼鼓喧天地對外宣佈。網易一直等到現在都沒有大力推AI戰略,李曉燕解釋到:“網易是一家產品公司,以推產品為主,很少提戰略。網易是從做產品開始,逐漸去呈現理念和對未來的願景。2017年網易已經開始對外商業化,但是並沒有全面鋪開而是選擇重點合作伙伴。”

AR作為互動介面

網易是一家重視互動的公司。丁磊說過一句代表公司文化的話:“好的互動就是沒有互動”。李曉燕本次的分享也都是圍繞“互動”來談人工智慧。在她看來,人工智慧的發展要在人與機器之間找到一個突破點,讓更多的人能跟科技互動,這種人人都能參與的互動比功能更有價值。

李曉燕談到,AR是一種全新的互動介面,能真正的連線物理世界和數字世界。這種新的互動介面下的內容形式包括了視覺的增強、音訊的增強、觸覺的增強,未來的AR互動介面是什麼樣子,或許還要再等幾年才能定義。現在我們看到手勢互動、語音互動、觸覺互動,每個互動手段都各有優劣勢,我們需要去研究如何在這幾種互動中無縫切換。AI技術是這些介面和內容背後的演算法基礎,包括語音技術、視覺技術、NLP等。下一代的互動介面會增強我們的感官能力和認知能力,是各大公司都在共同投入的願景。

因此,網易的AI戰略中,AR是濃墨重彩的一筆。

網易AR業務線有網易洞見、網易影見兩大產品。網易洞見是網易AR團隊自主研發的基於移動裝置的AR平臺,包括三個產品形態:網易洞見客戶端、網際網路應用引擎和AR遊戲引擎,支援網易自由的AR應用,同時為AR開發者賦能。網易影見是網易研發的擴增實境互動投影模組,可以將任意平面轉化為顯示螢幕,實現觸碰互動、空中手勢、物體互動等多維度互動方式。

AR還處於發展早期,為消費者提供豐富的內容極為重要。網易的內容研發立足於網易自身的遊戲、電商、營銷等方面。網易AR的代表作《悠夢》已經登入ARKit、ARCore等平臺。李曉燕認為網易在AR內容研發商領先行業半年到一年的時間。

蘋果和網易一樣,同時重視AI與AR。2017年6月,蘋果在WWDC上釋出ARKit,使得上億手機擁有AR體驗,點燃AR發展。而蘋果CEO庫克也談到,手機AR是AR發展的過渡環節,AR眼鏡是更為終極的產品形態,蘋果也將於2021年推出AR眼鏡。

網易也在佈局AR眼鏡,2018年1月,網易曾與矽谷Amber工作室合作推出售價199元的插手機的HoloKit眼鏡盒子,網易特意成立了HoloKit創新實驗室。

AI平臺與深度定製

2018年,網易AI平臺對外開放,平臺包括影象處理、語音語言、資料智慧等多項AI技術,提供多領域全套解決方案。

在語音語言方面,網易推出了“網易見外”,其是國內首款基於神經網路機器翻譯NMT技術,集視訊聽翻、直播聽翻、語音轉寫、文件直翻功能為一體的AI智慧語音轉寫聽翻平臺。

雷鋒網曾詳細介紹過網易子公司網易有道的AI戰略,語音識別、翻譯都是有道的核心AI能力,目前有道也有自己的AI開放平臺,賦能B端,網易有道目前主要有教育、政企、智慧硬體極大核心場景,與網易沒有直接衝突。 

李曉燕談到,目前網易有道的語音識別服務端呼叫的是網易的,神經網路翻譯技術也是網易率先突破。

雷鋒網(公眾號:雷鋒網)好奇,BAT也在做全開放的AI平臺,希望能通過AI平臺,輸出AI技術能力賦能B端,成為AI時代的帶隊者。作為第二梯隊的網際網路巨頭公司,網易的AI平臺與BAT有什麼不同呢?

李曉燕談到,網易是一家C端公司,在AI時代也在沉澱B端能力。目前,網易AI平臺主要服務於網易全系產品,對外是開放平臺,但是與BAT不同的是,網易還提供深度定製,團隊內部有一部分的成員會支援客戶做深度定製的AI專案。

耕耘AI七年,以產品和互動為核心的網易,還沒打算喊出all in AI的口號。不過從這次的交流會看來,網易也已經展開了全方位的佈局。未來的互動介面,或許會有一部分的想象力來自網易。

相關文章:

詳解網易有道AI戰略,智慧硬體、教育、辦公三大解決方案

相關文章