Google X 部門通過1.6萬片處理器構建了一個龐大的系統,用於模擬人類的大腦神經網路。藉助“谷歌大腦”,無需接受人類的任何培訓和指令,就可以利用內在演算法從海量資料中自動提取資訊,學會如何識別貓咪。
模擬人腦
無人駕駛汽車和擴增實境眼鏡是 Google X 最著名的兩個專案,但作為谷歌最神祕的部門,這裡的研究遠不止此——早在幾年前,他們就成立了專門的團隊,模擬人腦的執行方式。
為了研究機器學習,谷歌的科學家將1.6萬片電腦處理器連線起來,創造了全球最大的神經網路之一,讓它們在網際網路中“自學成才”。
面對從 YouTube 視訊中找到的 1000 萬張數字照片,這個“谷歌大腦”會幹什麼?答案是:與數以百萬普通 YouTube 使用者相同——找貓咪。
這個神經網路依靠自學認出了貓咪,這可不是無聊之舉。本週,研究人員就將在蘇格蘭愛丁堡的一次會議上展示他們的成果。谷歌的科學家和程式設計師指出,網際網路上充斥著貓咪視訊算不上什麼新聞,但這種模擬的效果還是令他們大吃一驚。與之前的任何專案相比,該神經網路的效果都要好得多:面對 2 萬種截然不同的物體,它的辨識能力幾乎翻了一番。
藉助“谷歌大腦”,無需接受人類的任何培訓和指令,就可以利用內在演算法從海量資料中自動提取資訊,學會如何識別貓咪
這項研究是新一代電腦科學的代表,這類研究專案充分利用了計算資源的成本下滑,以及龐大資料中心的日益增多。該技術還大力推動了眾多領域的進步,包括機器視覺與感知、語音識別、語言翻譯等。
熱門課題
儘管研究人員所使用的電腦科學理念並不新穎,但有了如此大規模的軟體模擬,使得原本不可想象的學習系統成為了可能。谷歌研究人員並不孤獨,全球還有很多科學家都在研究這種“深度學習”模式。去年,微軟科學家就證明,利用同樣的技術,也可以藉助電腦系統很好地理解人類的語言。
“這是當今語言識別領域最熱門的課題。”紐約大學庫朗數學研究所計算機學家嚴恩·樂庫(Yann LeCun)說,他專門從事機器學習的研究。
當然,識別貓咪也具備同樣的意義。為了做到這一點,由史丹佛大學計算機學家安德魯·恩吉(Andrew Y. Ng)和谷歌院士傑夫·迪恩(Jeff Dean)領導的這支團隊,使用了1.6萬片處理器創造了一個擁有 10 億多條連線的神經網路。他們隨後為這個網路隨機呈現出縮圖,每一張都是從 1000 萬段 YouTube 視訊中抽取出來了。
由於這些視訊都是隨機選取的,所以這本身也反映出人們在網際網路時代的喜好。然而,研究成果卻很顯著。研究人員創造的這個以軟體為基礎的神經網路,顯然準確地印證了生物學家的理論——單個神經元通過在大腦內接受的訓練,獲得識別物體的能力。
自學成才
目前有很多投入商用的機器視覺技術,它們都可以根據人類的指令進行學習,從而識別出某些特性。但在谷歌的研究中,機器並未得到任何外在幫助,完全“自學成才”。
“我們的理念是:不需要藉助大批研究人員找出事物之間的差異,只要為演算法提供海量資料,讓資料自己說話,讓軟體自動學習資料。”恩吉說。
“我們從沒在培訓過程中教它貓長什麼摸樣。”迪恩說,“從本質上講,它發明了‘貓’這個概念。我們的資料中很可能還有一些貓的側面照片。”迪恩幫助谷歌設計了這款軟體,使之可以輕易將程式分解成許多工,並實現同步計算。
在看過數百萬張圖片後,這個“谷歌大腦”構建出一張理想的貓咪數碼圖片,利用不同層級的儲存單元成功提煉出貓的基本特性。然而,科學家認為,他們似乎是在控制論層面,模擬了人類大腦視覺皮層的運作方式。
神經學家認為,可能存在一種名為“祖母神經元”的東西。這是一種具有特定用途的腦細胞,一旦被反覆“訓練”去識別某一張人臉時,這種細胞便會被啟用。
“你需要通過重複才能認出一位朋友。”Industrial Perception 公司的神經學家加里·布拉德斯基(Gary Bradski)說。
應用前景
貓咪照片、人臉和身體各個部位同時在電腦模型的特定記憶區域出現,令科學家頗為振奮。儘管如此,恩吉教授表示,在拿這套軟體系統與生物大腦進行對比時,他仍然很謹慎。
“做個不太嚴謹的對比,我們的數字引數就相當於突觸。”恩吉說。但他指出,儘管科學家動用了龐大的計算能力,但與大腦中的連線數量相比,仍然相形見絀。
研究人員寫道:“值得注意的是,我們的網路與人類的視覺皮層相比仍然很渺小,後者的神經元和突觸數量比該網路多 100 萬倍。”
儘管規模遠遜於生物大腦,但谷歌的研究仍然提供了全新的證據,表明海量資料有助於大幅改進現有的機器學習演算法。
“史丹佛/谷歌的論文通過遠超以往的數量級突破了神經網路研究的極限規模。”喬治亞理工學院高效能運算專家大衛·巴德爾(David Bader)說。他表示,高速增長的計算機技術將在相對較短的時間內縮小這一差距:“完全模擬人類的視覺皮層有望在 2020 年前實現。”
谷歌的科學家表示,該研究專案如今已經走出 Google X,受到搜尋以及相關服務部門的追捧,有望被用於改善圖片搜尋、語音識別、機器語言翻譯質量。
儘管取得了成功,但谷歌研究人員仍對他們是否已經掌握機器自學技術的要領保持謹慎。“如果我們只需要在現有演算法的基礎上繼續增大規模,那就太好了。但我感覺,我們還沒有找到正確的演算法。”恩吉說。