雖然科幻電影描繪人工智慧已經到機器能夠獨立思考的程度,但在現實生活中,受限於硬體裝置的處理能力和程式設計邏輯的複雜性,我們身邊的的人工智慧仍然顯得比較幼稚和容易理解——畢竟人類創造了所謂的人工智慧,它們不可能超乎人類所能理解的範疇發展。
但谷歌的“深度學習(deep learning)”系統卻顛覆了這一常識,谷歌的工程師都表示這套原本只是用來做實驗的決策計算機系統表現超乎想象,它通過照片識別事物的能力早已超乎了谷歌工程師的預料,谷歌工程師甚至已經不知道計算機究竟在“想”些什麼了。
識別系統的基礎
谷歌軟體工程師Quoc V. Le在上週五舊金山的機器學習大會(Machine Learning Conference)上談到了這套深度學習系統。這是一套包含了大量伺服器群,能夠收集並自動對資料作歸類的系統,谷歌打算用它來深度研究AI技術。在谷歌手中,此係統的服務應用包括了Android的語音控制搜尋、圖片識別和谷歌翻譯。
深度學習系統曾在去年6月份引起過不少討論,當時紐約時報刊文稱谷歌的DistBelief技術(一個採用普通伺服器的深度學習平行計算平臺)在獲取數百萬YouTube視訊資料後,能夠精準地識別出貓的特徵。未來,這套系統或是能夠準確識別谷歌街景照片中門牌號碼、網站中人臉圖片等的技術依託。
深度學習技術理論上也是分層結構。其神經網路的最底層可檢測到圖片畫素在色彩上的變化,上層隨後可瞭解圖片中出現特定事物的邊緣部分。位於再上層的幾個連續的分析層可通過系統的不同分支學會人臉、搖椅、計算機等各種型別事物的檢測方法。
它們真的在“獨立思考”
Quoc V. Le說,令他最為震驚的事情是,深度學習系統能夠輕易地學習總結出類似碎紙機等物體的特性,這些甚至是普通人類難以輕易做到的。“怎樣在系統設計中讓軟體能夠具備識別碎紙機的能力,這是相當複雜的。我在這方面花了很多的時間,但就是難以完成。”
實際上Quoc也曾給身邊的好多朋友看了碎紙機的照片,但在隨後的識別過程中,具有高等智慧的人類卻遭遇了麻煩。而谷歌的深度學習計算機系統則在這方面具有極高的識別成功率,可關鍵問題是,Quoc自己也不知道他所寫的程式是如何做到這一點的。
也就是說,谷歌的工程師們已經無法解釋這套系統識別事物的方法和邏輯,它們更像是脫離了其建立者的控制在獨立思考,這種複雜的認知方式更是令人不可思議。雖然這種層面的“獨立思考”範圍還非常有限,但在實際應用中卻真實有效,能夠解決實際問題。谷歌負責AI研究的主管Peter Norvig認為這種能夠實現大量資料統計的模型對於解決如語音識別與理解一類的複雜問題具有非常積極的意義。
結論
Quoc說,對谷歌而言,深度學習系統能夠解決人類所不能解決的問題,自然也就是節約人力成本的好東西。將其更多的潛力挖掘出來,總好過僱傭一批每年拿著無數酬勞的高階專家。“機器學習非常複雜,我們需要花大量的時間在資料處理和特性更新上。甚至為了解決一個獨立的問題,我們就需要聘請這一領域的專家。以後我們期望能夠跳脫這樣的模式,我們沒法解決的問題,就讓機器去完成。”
而且谷歌實際也在開發其他類似的決策選擇系統,如Borg與Omega,這些系統在分配工作負荷時,行為方式也更像是活物。將來,機器的“獨立思考”或將真正成為可能。至少現在,我們讓計算機與人類達成了這樣的協作關係。