谷歌“學習機器人”:機器像人腦一樣思考

pythontab發表於2013-01-17

  讓機器像新生兒的大腦一樣進行自我學習和思考,這聽上去不可思議的場景正在谷歌代號為“Google X”的秘密研發部轉變為現實。


  近日,Google 科學家傑夫·狄恩(Jeff Dean)告訴《第一財經日報》記者,“Google X”實驗室透過連線 16000 臺計算機處理器,建立了一個機器學習的神經元網路系統。結果發現,這個系統自己學會了對貓的辨認。


  去年夏天, Google X 利用這一由 16000 多個處理器、10 億個內部節點組成的虛擬大腦,分析了 1000 萬幀從 Youtube 上隨機抓取的無標籤影片剪輯圖片,經過了 10 天時間的運轉,“大腦”終於認識了什麼是貓,並從接下來輸入的 2 萬張圖片中準確找出了貓的照片。


  和傳統的機器視覺技術不同,它們是根據人類的指令進行學習,從而識別出某些特性。但在谷歌研究中,工程師們無需預先向機器輸入某一概念,該系統就能在並未得到任何外在幫助的前提下“自學成才”。


  “我們在訓練的時候從未告訴過那是‘貓’,系統只是自行建立了貓這個概念。”傑夫·狄恩告訴記者,“大腦”是自己從未標記的 YouTube 靜態圖片中發現了貓是什麼樣子,這就是“自我學習”。


  他向記者解釋谷歌機器學習的理念:用眾多的電腦模擬人腦中的“神經元”,形成一個“神經網路”。它不需要藉助大批研究人員幫助電腦標明事物之間的差異,只要為演算法提供海量的資料,“神經元”與“神經元”之間的關係將會發生變化,讓資料自己說話,讓組成“神經網路”的機器具備自動學習、識別資料的能力,在新的輸入中找出與學到的概念對應的部分,達到識別的效果。


  例如,在看過數百萬張圖片後,谷歌的虛擬大腦將自己構建出一張理想的貓的圖片,利用不同層級的儲存單元成功提煉出貓的基本特性。有科學家認為,這似乎是在控制論層面模擬了人類大腦視覺皮層的運作方式。


  不過這一機器學習技術並不僅僅侷限在影像方面。目前,Google 正在將該虛擬人腦用於提升語音識別的準確率。傑夫·狄恩介紹,GoogleX 團隊曾和谷歌語音識別團隊有過一次合作,5 天內在 800 個機器上進行訓練,就單字錯誤檢出率而言,該系統已讓 Google 的語音識別準確率提升了 25%,這相當於研究語音識別 20 年的成果。


  但目前,這一研發只有一年半的實驗專案,距離商用或許還有不遠的距離。傑夫·狄恩說,現在機器學習技術還未達到完美,有時出現劣質的轉錄文字、滑稽的翻譯結果或者錯誤識別的影像,但相信在未來,機器學習可以變得更準確,越來越聰明。他預計,未來這項機器學習技術將用以幫助實現高質量的語音識別、實用型計算機視覺、攔截垃圾郵件,甚至應用於谷歌自動駕駛汽車。


  有外媒報導,曾有加拿大蒙特利爾大學的一位研究機器學習的教授 YoshuaBengio 在看了谷歌的演示後表示,谷歌的虛擬人腦技術讓人類離人工智慧的終極目標又進了一步。“事實上,該系統的執行模式已經和哺乳動物甚至人類大腦的某些工作模式有些像了。Google 的這個虛擬人腦有點類似於哺乳動物大腦中一個叫做視覺皮層的部位,能夠透過視覺發現物體。” YoshuaBengio 說。


  這是否意味著出現了機器代替人腦的苗頭?傑夫·狄恩給出的答案是:“誰也不能預測未來 10~20 年機器學習的發展方向。”他提到,目前谷歌機器學習僅限於認知類的簡單工作,至於說幫助人們做規劃、協調工作關係等等,恐怕需要另外一些能力。


  從計算技術角度來說,神經網路成本非常昂貴。傑夫·狄恩並沒有給出具體的數字,但介紹,通常機器學習領域使用的大多數網路中只使用了 100 萬到 1000 萬個連線。但谷歌現在正在積極擴充套件系統,以訓練更大規模的模型。


  “雖然現在還沒有公認的方式將人工神經網路和生物大腦進行對比,但為了讓大家大概地感覺到所謂的‘更大規模’,可以和人腦做一個很粗略的比較 —— 普通成人大腦大約有 100 萬億個連線。在這一領域,更大規模機器學習有著難以想象的發展空間。” 傑夫·狄恩說。


相關文章