中國搜尋巨頭百度僱用了“谷歌大腦”的幕後人物

武衛東發表於2014-05-18

這篇文章譯自《麻省理工技術評論》,與前一篇Wired的文章角度不同。


【概要】曾經在谷歌工作過的頂尖的人工智慧研究者吳恩達,將率領中國的百度的研究部門,創造出理解世界的軟體。

Tom Simonite 2014/5/16報導

由於統治了中國的搜尋市場,百度一直被稱作“中國的谷歌”。如今,這種類比更顯得恰如其分:百度在矽谷成立了新的研究實驗室,領軍人物是史丹佛大學教授吳恩達,他曾在谷歌的深度學習領域扮演過重要角色。吳還是線上學習公司Coursera的聯合創始人。

新近的進展在矽谷觸發了一場技術上的軍備競賽,大型網際網路公司競相網羅頂尖的學術人才。谷歌、Facebook等公司爭相投資深度學習,百度也被人工智慧方面的重大進展所揭示的美好前景所鼓舞。

深度學習可以讓機器利用模擬的簡單神經元網路處理海量資料,這是對生物體大腦粗略建模得來的。通過這一方法,人們已經可以對軟體進行重大改進,更好地執行圖象和語音識別等任務,最終它可能使得app、裝置和網際網路服務像人類那樣去理解圖象和文字等一切事物。

雖然深度學習最早是在學術圈提出,但大家對它的興趣突發卻是在2012年穀歌研究人員和吳恩達一道宣佈了一個驚天的計劃之後,該計劃被形象地稱為“谷歌大腦”。他們編制的軟體分析了從YouTube視訊拍攝下來的1千萬張照片,能夠無需人的干預學會辨認成千個物體,包括人臉和貓臉。

由此開始,美國各大技術公司開始爭相聘請這個不大的研究領域的頂尖人才,向大家展示深度學習可以如何改進他們提供給消費者的技術。谷歌和微軟已經使用深度學習改善了語音識別和翻譯。同時,Facebook的深度學習研究人員最近也宣佈人臉識別軟體已經接近了人類的處理水平。

據百度北京的深度學習研究院主任餘凱介紹,在決定開設桑尼維爾的新的實驗室之前,百度已經從2012年底向若干產品增加了深度學習的演算法,並且取得了良好的效果。百度翻譯應用中使用了這個技術,可以在智慧手機上根據中英文名稱識別出物體來。百度的廣告定位技術也用上了深度學習。餘凱說:“在廣告系統里加入了深度學習,我們立刻得到了回報,點選率得到了巨大的提升。”

餘凱的北京實驗室重點是對百度現有產品和即將釋出的產品使用深度學習技術。他介紹說,新的矽谷實驗室將進行一些更為基礎性的研究。希望這樣寬泛的職責,吳恩達的明星效應,以及百度擁有的海量的圖象、文字和視訊資料,可以吸引頂尖的人才加入。餘凱說:“矽谷有著巨大的人才庫,世界上絕無僅有,我們特別希望從矽谷實驗室裡做出革命性的成果出來。”

吳恩達將以百度首席科學家的身份指導這些工作,他將全面負責矽谷的實驗室、餘凱的實驗室,以及北京的另一個專攻大資料的實驗室。他主要在桑尼維爾實驗室工作,百度會在未來5年向這個實驗室投入3億美元。

該實驗室的研究工作由Adam Coates領導,他以前是吳恩達在史丹佛的研究小組裡的博士生和博士後研究員。Coates說研究室的主要工作是構建出無需人的干預即能學習的軟體,就像“谷歌大腦”的做法一樣,這一方法被稱作無監督學習。

無監督系統的執行不需要程式設計師做太多工作,但目前來看精確度還很低,至少跟人類還不能比。比如,谷歌的貓臉識別系統的精確率還只有70%。Coates說:“最大的一個有待解決的問題是:‘如何用無監督學習達到人類的識別水平?’”不過話說回來,這方面只要取得一點點進展,得到的回報都會是十分巨大的。他說:“因此我們想構建的許多產品都是用來跟世界互動的,比如機器人,比如自動駕駛汽車,比如移動應用。”

普度大學研究人員Eugenio Culurciello從事的研究是植入了神經網路的晶片,他認為深度學習的熱潮是合乎情理的。他指出深度學習的方法已經顛覆了人們評估機器學習軟體的指標體系:“以前人們只能把系統改進2%左右,而這些人卻能讓系統改進10-20%。”

這也很好地解釋了為什麼去年Facebook的CEO馬克·祖克伯會出人意料地出現在NIPS神經網路大會上。不過,科羅拉多大學Boulder分校的Michael Mozer教授(也是NIPS基金會的董事)指出,當前神經網路使用的核心演算法,與20世紀80年代末曾引發人工智慧熱潮時所用的演算法大同小異。他認為最近的突破主要在於人們找到了一些“竅門”可以在很大的規模上使用這些演算法。“那些一直痴心不改的研究人員理應收穫成果了,”他說,不過在人工智慧領域,深度學習還算不上有時候宣傳的那樣重大的突破。

Culurciello認為,目前能夠熟練掌握這些訣竅,使深度學習能發揮作用的人才還不多。他說:“如果你想在群雄逐鹿中有所作為,就得盡力去招賢納士,找來真正精通這個技術的人才,否則,一轉眼就會落後好幾年。”

相關文章