中國搜尋巨頭百度僱用了“谷歌大腦”的幕後人物
這篇文章譯自《麻省理工技術評論》,與前一篇Wired的文章角度不同。
【概要】曾經在谷歌工作過的頂尖的人工智慧研究者吳恩達,將率領中國的百度的研究部門,創造出理解世界的軟體。
Tom Simonite 2014/5/16報導
由於統治了中國的搜尋市場,百度一直被稱作“中國的谷歌”。如今,這種類比更顯得恰如其分:百度在矽谷成立了新的研究實驗室,領軍人物是史丹佛大學教授吳恩達,他曾在谷歌的深度學習領域扮演過重要角色。吳還是線上學習公司Coursera的聯合創始人。
新近的進展在矽谷觸發了一場技術上的軍備競賽,大型網際網路公司競相網羅頂尖的學術人才。谷歌、Facebook等公司爭相投資深度學習,百度也被人工智慧方面的重大進展所揭示的美好前景所鼓舞。
深度學習可以讓機器利用模擬的簡單神經元網路處理海量資料,這是對生物體大腦粗略建模得來的。通過這一方法,人們已經可以對軟體進行重大改進,更好地執行圖象和語音識別等任務,最終它可能使得app、裝置和網際網路服務像人類那樣去理解圖象和文字等一切事物。
雖然深度學習最早是在學術圈提出,但大家對它的興趣突發卻是在2012年穀歌研究人員和吳恩達一道宣佈了一個驚天的計劃之後,該計劃被形象地稱為“谷歌大腦”。他們編制的軟體分析了從YouTube視訊拍攝下來的1千萬張照片,能夠無需人的干預學會辨認成千個物體,包括人臉和貓臉。
由此開始,美國各大技術公司開始爭相聘請這個不大的研究領域的頂尖人才,向大家展示深度學習可以如何改進他們提供給消費者的技術。谷歌和微軟已經使用深度學習改善了語音識別和翻譯。同時,Facebook的深度學習研究人員最近也宣佈人臉識別軟體已經接近了人類的處理水平。
據百度北京的深度學習研究院主任餘凱介紹,在決定開設桑尼維爾的新的實驗室之前,百度已經從2012年底向若干產品增加了深度學習的演算法,並且取得了良好的效果。百度翻譯應用中使用了這個技術,可以在智慧手機上根據中英文名稱識別出物體來。百度的廣告定位技術也用上了深度學習。餘凱說:“在廣告系統里加入了深度學習,我們立刻得到了回報,點選率得到了巨大的提升。”
餘凱的北京實驗室重點是對百度現有產品和即將釋出的產品使用深度學習技術。他介紹說,新的矽谷實驗室將進行一些更為基礎性的研究。希望這樣寬泛的職責,吳恩達的明星效應,以及百度擁有的海量的圖象、文字和視訊資料,可以吸引頂尖的人才加入。餘凱說:“矽谷有著巨大的人才庫,世界上絕無僅有,我們特別希望從矽谷實驗室裡做出革命性的成果出來。”
吳恩達將以百度首席科學家的身份指導這些工作,他將全面負責矽谷的實驗室、餘凱的實驗室,以及北京的另一個專攻大資料的實驗室。他主要在桑尼維爾實驗室工作,百度會在未來5年向這個實驗室投入3億美元。
該實驗室的研究工作由Adam Coates領導,他以前是吳恩達在史丹佛的研究小組裡的博士生和博士後研究員。Coates說研究室的主要工作是構建出無需人的干預即能學習的軟體,就像“谷歌大腦”的做法一樣,這一方法被稱作無監督學習。
無監督系統的執行不需要程式設計師做太多工作,但目前來看精確度還很低,至少跟人類還不能比。比如,谷歌的貓臉識別系統的精確率還只有70%。Coates說:“最大的一個有待解決的問題是:‘如何用無監督學習達到人類的識別水平?’”不過話說回來,這方面只要取得一點點進展,得到的回報都會是十分巨大的。他說:“因此我們想構建的許多產品都是用來跟世界互動的,比如機器人,比如自動駕駛汽車,比如移動應用。”
普度大學研究人員Eugenio Culurciello從事的研究是植入了神經網路的晶片,他認為深度學習的熱潮是合乎情理的。他指出深度學習的方法已經顛覆了人們評估機器學習軟體的指標體系:“以前人們只能把系統改進2%左右,而這些人卻能讓系統改進10-20%。”
這也很好地解釋了為什麼去年Facebook的CEO馬克·祖克伯會出人意料地出現在NIPS神經網路大會上。不過,科羅拉多大學Boulder分校的Michael Mozer教授(也是NIPS基金會的董事)指出,當前神經網路使用的核心演算法,與20世紀80年代末曾引發人工智慧熱潮時所用的演算法大同小異。他認為最近的突破主要在於人們找到了一些“竅門”可以在很大的規模上使用這些演算法。“那些一直痴心不改的研究人員理應收穫成果了,”他說,不過在人工智慧領域,深度學習還算不上有時候宣傳的那樣重大的突破。
Culurciello認為,目前能夠熟練掌握這些訣竅,使深度學習能發揮作用的人才還不多。他說:“如果你想在群雄逐鹿中有所作為,就得盡力去招賢納士,找來真正精通這個技術的人才,否則,一轉眼就會落後好幾年。”
相關文章
- 外媒:中國搜尋引擎巨頭百度推出區塊鏈原創圖片服務平臺區塊鏈
- 海量資料搜尋---demo展示百度、谷歌搜尋引擎的實現谷歌
- 各大網際網路巨頭的搜尋引擎交鋒PGB
- 聊聊百度搜尋背後的故事
- 不會被篡改的谷歌?這家搜尋引擎巨頭正在關注區塊鏈在審計方面的應用谷歌區塊鏈
- 谷歌搜尋正在死去 | DKB谷歌
- 谷歌搜尋用上BERT,10%搜尋結果將改善谷歌
- 網頁版“頭條搜尋”悄然上線,今日頭條想成為國內知名搜尋引擎網頁
- 百度簡單搜尋PC版玩法攻略 簡單搜尋有電腦版嗎?
- 戲說中國網際網路5大巨頭
- 使用Google百度等搜尋引擎的常用搜尋技巧Go
- 【轉載】SAP 選擇螢幕中的搜尋幫助
- 為什麼中美搜尋引擎巨頭都能成為人工智慧先鋒?人工智慧
- 百度地攤經濟搜尋大資料大資料
- see-world雲搜|輕鬆使用谷歌搜尋谷歌
- OpenAI新AI搜尋將顛覆谷歌等傳統搜尋引擎OpenAI谷歌
- 電腦搜尋工具:Listary
- 黃了。Google中國版搜尋Go
- OpenAI深夜突發SearchGPT!進軍大模型搜尋,谷歌、Perplexity危OpenAIGPT大模型谷歌
- win10谷歌瀏覽器怎樣設定用谷歌搜尋引擎 win10谷歌瀏覽器使用谷歌搜尋引擎的設定方法Win10谷歌瀏覽器
- 百度搜尋大資料:海外疫情持續擴散 “回國”相關內容搜尋熱度飆升100%大資料
- 中國網際網路的巨頭們,為何敢“大資料殺熟”?大資料
- 初識搜尋:百度搜尋產品經理的第一課
- 有贊搜尋系統的技術內幕
- 模擬百度搜尋
- 跬步至千里:揭秘谷歌AutoML背後的漸進式搜尋技術谷歌TOML
- ChatGPT“大戰”谷歌搜尋:新王加冕還是舊王延續?ChatGPT谷歌
- Chrome的強大搜尋功能Chrome
- 谷歌自帶的線上工具和常用搜尋技巧谷歌
- 如何在Mac電腦中搜尋隱藏檔案?Mac
- 谷歌大腦提出NAS-FPN:這是一種學會自動架構搜尋的特徵金字塔網路谷歌架構特徵
- 谷歌拿下搜尋廣告收入的最大份額,緊隨其後的居然是它?!谷歌
- 跬步至千里:揭祕谷歌AutoML背後的漸進式搜尋技術谷歌TOML
- SimilarWeb:2020年64.82%的谷歌搜尋沒有任何後續點選就結束了MILAWeb谷歌
- 谷歌上線資料搜尋引擎 Dataset Search谷歌
- OpenAI深夜丟炸彈硬槓谷歌搜尋OpenAI谷歌
- 搜尋欄獲取百度suggestion
- 大資料究竟有多“大”?谷歌搜尋的規模為 62 PB,排名倒數第一大資料谷歌
- 中國網際網路首現搜尋框掛馬“114搜尋”被“黑”