柯潔大戰AlphaGo時,我們和谷歌雲機器學習負責人李佳聊了聊

杜夏德發表於2017-05-24

本次烏鎮人機大戰期間,谷歌雲機器學習負責人李佳在會場首次接受國內媒體採訪。從去年11月加入谷歌以來,李佳在谷歌雲的工作主要圍繞人工智慧四大支柱:資料、計算能力、演算法和人才展開。


谷歌雲積極擴充企業客戶

雲端計算已成為包括AWS和微軟在內等大公司的重要營收渠道,根據亞馬遜2017年第一季財報,AWS雲服務為亞馬遜總收入貢獻了10%,而為淨利潤貢獻了80%以上。目前谷歌雲也在積極拓寬企業客戶市場。

從Mobil first 轉向AI First後,谷歌的所有產品中都有機器學習的影子,據李佳介紹,“在消費級產品上,我們有10億級的使用者都能體驗到機器學習產品”。谷歌雲也會將消費級產品上實現的成功經驗和新研發帶給企業級別的使用者,比如一些遊戲公司、旅遊公司擴充海外業務時,可以使用谷歌最新的神經機器翻譯系統。在自然語言處理上,英國的線上超商Ocado,在谷歌雲上使用自然語言處理的 API收集客戶的反饋意見,並根據緊急、需要什麼樣的反饋,來進行分類,實現了更加自動化的客戶支援系。

谷歌雲也不乏一些大客戶。AirBus在使用谷歌雲上的API識別複雜的衛星雲圖,HSBC則使用谷歌雲進行反洗錢和風險預估,此外還包括高露潔、匯豐控股和eBay。李佳曾任研究高管的Snapchat也在今年2月成為谷歌雲最大的客戶,每年支付4億美元。

李佳提到,很多公司剛找到她們時的想法相當直接,希望機器學習能給他們的公司帶來顛覆性的改變,但是谷歌會根據每家公司各自的人工智慧背景,來提供適合他們的服務。對於對AI有所準備的公司直接提供一個端到端的API。那些對機器學習還很陌生的公司可以參與谷歌雲今年開發的新專案,“先進技術實驗室”。這個專案是由原本谷歌內部的AI人才培訓專案對外開放而來,它向其他有意培養機器學習人才的公司提供培訓機會,讓他們的員工進入谷歌,與工程師和技術專家一起做研發。


Visual Genome:升級版的ImageNet

2016年初,李佳等人提出了Visual Genome ,一個相比與ImageNet更加豐富的影象資料集。該資料集是首個提供結構化圖片描述的資料集。

李佳告訴機器之心記者,建立Visual Genome資料集也是考慮到資料對人工智慧發展的重要性。大家都很瞭解ImageNet,ImageNet實現了很多演算法的訓練和發展。但是ImageNet只是對圖片進行描述,對圖片中的物體進行分類和檢測。而Visual Genome相當於ImageNet的升級版,“我們想在視覺理解的方面有更一步的發展,包括物體之間的關係,和對物體更進一步的描述,它會考慮更復雜的場景和更復雜的影象,幫助研究者來思考更深層面的問題,包括怎樣對圖片和圖片中的區域性進行深入描述。”同時這個資料集也是開放的。


與李飛飛合作十幾年,亦師亦友

提到博導李飛飛,讓人意外的是,李飛飛是得知李佳進入谷歌之後才最終選擇谷歌。李佳坦言從師生到同事,跟著李飛飛十幾年的學習和合作,之間建立了深厚的信任,這在工作中非常重要,“一個人處理一件事,另外一個人可以完全放心”。目前兩人在谷歌雲的工作相互促進,並沒有明確的區分。

離開Snapchat後,李佳選擇谷歌雲的一個很大原因是她看到很多優秀的AI人才聚集在幾家高科技公司或者獨角獸公司中,其他傳統公司卻沒有這個機會。谷歌雲能夠把機器學習和人工智慧帶給更多的公司,“能看到自己的技術成果能影響到各行各業,讓我感覺非常exciting。”

相關文章