2016:深度學習獨領風騷的一年

AI科技大本營發表於2017-07-20

2016:深度學習獨領風騷的一年


作者: CADE METZ

編譯: AI100

原文地址:

https://www.wired.com/2016/12/2016-year-deep-learning-took-internet


在澳大利亞的西海岸, Amanda Hodgson正在向印度洋發射無人機。這些無人機是用來拍攝水面照片的。人們可以通過這些照片,定位在珀斯附近海灣棲息的儒艮,從而保護這些瀕臨滅絕的海洋哺乳動物。但主要的問題在於,Hodgson和她的團隊沒有時間來檢查所有的航拍照片。這些照片數量龐大,大約有45000張。而且對於未受過訓練的人來說,發現這些動物不是一項容易的事情。所以她把這項工作交給一個深度神經網路來處理。

如今的神經網路應用廣泛:它們可以用來識別,推送給你的Facebook新聞圖片中的面孔;可以用來理解你向自己安卓手機提出的問題;可以幫助Google搜尋引擎的高效執行。神經網路模型的構建,受到了人腦神經元的網路結構的啟發。這些基於資料掃描的數學模型,通過廣泛分析輸入埠的數字離散資料,學習得到相關模型,完成對應任務。現在,珀斯默多克大學的海洋生物學家Hodgson正在使用這種技術,從成千上萬張拍攝於自然水域的照片中定位儒艮。她的神經網路在開源框架TensorFlow上執行,這一開源的深度機器學習框架,是由谷歌提出的。

如霍奇森所提到的,由於儒艮通常在海面下進食,因此檢測儒艮的任務相對比較困難。她解釋道,“它們可能被誤認為白色的水,或者水面上的眩光。”但是她這裡使用的神經網路模型,現在已經可以正確識別大約80%的分佈在海灣的儒艮。

這一專案仍處於早期階段,但它已經表明了深度學習在過去一年的廣泛影響。在2016年,這個年代久遠,但卻非常強大的技術,幫助了一臺谷歌團隊研發的機器,在一項古老的遊戲(即圍棋)上擊敗了世界頂級棋手之一。而就在幾個月前,人們對於這一點,還表示深深懷疑。但這只是深度學習應用最突出的例子。隨著這一年的結束,深度學習不再是晚會的戲法,不再是象牙塔裡的研究。它從內到外,徹底改變了諸如谷歌,Facebook,微軟和亞馬遜等公司。深度學習在世界範圍內的迅速傳播,也在很大程度上歸功於這些網際網路巨頭開源軟體以及提供的雲端計算服務。

新的翻譯形式

在過去幾年中,GooglePhotos等應用,基於神經網路技術,改進了影象識別功能。同時,在Google Now和Microsoft Cortana等虛擬助理上,通過應用神經網路技術,將語音識別的準確率顯著提高。而在今年,基於這項技術,Google團隊實現了機器翻譯效能的飛躍。這裡提到的機器翻譯具體是指,機器自動將語言從一種語言翻譯成另一種語言的能力。9月份,Google推出了一項名為Google Neural MachineTranslation(谷歌神經網路翻譯)的新服務,它完全基於神經網路執行。據該公司稱,這種新型翻譯模型,在某些語言之間的翻譯任務上,錯誤率降低了55%到85%。

Google在訓練該神經網路時,根據自己已有的大量翻譯資料進行訓練。其中的部分訓練資料包括舊版Google翻譯應用提供的翻譯資料,翻譯效果相對不如人意。但訓練資料中,同時包括翻譯專家的翻譯結果。根據這些質量參差不齊的訓練資料,我們可以對訓練集的質量進行評價。深度學習的一大優勢就在於,它可以克服質量較差資料(即負樣本)的影響。具體來說,只要輸入足夠的資料,即使存在負樣本,它也可以基於這樣的訓練集,最終達到輸出效果遠遠好於負樣本的效果。

Google方面的首席工程師MikeSchuster,不介意承認這樣的工作遠非完美。但同時表示,目前的成果,仍然是一大突破。由於該服務完全基於深度學習框架,因此Google可以更輕鬆地繼續改進相關服務。它可以將整個系統作為一個整體,對整體框架結構進行改進。而不是類似過去基於特徵工程的方法,過多關注細枝末節。

與此同時,微軟也正朝同一個方法努力。這個月(即12月),它對外發布了新版本的微軟翻譯應用。這一應用,可以幫助實現最多九個不同語言的人之間的即時對話。這個新系統幾乎完全執行在神經網路上,微軟副總裁HarryShum,同時也是該公司的AI和研究小組負責人,認為,這個應用的推出十分重要,因為這意味著微軟在機器翻譯這一領域,可能會有更快的進步。


新的聊天方式

在2016年,深度學習也在聊天機器人領域嶄露頭角。其中,最引人矚目的是,在今年秋天釋出的Google Allo。Google Allo,可以對使用者收到的文字和圖片進行分析,並即時提供關於回覆的建議。它基於谷歌早期,與電子郵件功能比較類似的”SmartReply”技術。這次提出的Google Allo的一大優點在於,它在很大程度上沒有迴避目前機器學習技術存在的侷限性。它給出的建議回覆都比較簡短,而且同時返回多個結果。這樣做的原因在於,目前的人工智慧無法做到,保證始終給出正確的建議。

在Allo系統中,神經網路也可以幫助回答使用者對Google搜尋引擎提出的問題。它們幫助公司的搜尋引擎瞭解使用者需求,並幫助制定答案。根據GoogleResearch產品經理David Orr的說法,如果沒有深度學習,應用程式本身是不可能做到這一點的。“你需要使用神經網路,或者換句話說,至少這是我們目前找到的唯一方法。”他說,“我們必須使用我們目前掌握的所有最先進的技術。“

神經網路目前還無法進行真正的自主對話。不管CTO們在他們的展示中是如何承諾的,基於深度學習的聊天機器人在這個方向上,還需努力。但是,谷歌、Facebook和其他公司的研究人員正在深入研究深度學習技術,以實現這個終極目標。CTO們已經作出承諾,研究人員將通過努力,取得像我們現在看到的,深度學習在語音識別、影象識別和機器翻譯等領域上達到的效果。我們也可以預見,人機對話將成為下一個技術前沿。


新的資料中心管理方式

今年夏天,DemisHassabis和他的Google DeepMind實驗室,在成果構建了在圍棋上打敗頂尖人類選手的AI(AlphaGo)後,意識到這裡他們構建的AI,可以用於自動控制Google全球計算機資料中心網路。他們構建的人工智慧系統,通過深度強化學習技術,強化了機器學習圍棋的能力。而且深度增強學習技術,在他們早期的專案中也取得了成功。這些專案包括訓練機器“玩“Atari公司過去釋出的遊戲等。這裡他們訓練好的AI,可以自主決定何時開啟安裝在資料中心的數千臺計算機伺服器中的冷卻風扇,何時開啟資料中心視窗以進行額外冷卻,以及何時關閉昂貴的空調系統。總之,它可以控制每個資料中心內的120個相關功能。

正如彭博所報導的,這個人工智慧系統十分有效,已經幫助Google節省數億美元。換句話說,它抵消了收購DeepMind的成本。眾所周知,谷歌在2014年收購DeepMind,大約花費了6.5億美元。現在,Deepmind團隊計劃在資料中心的計算設施中安裝額外的感測器,從而使系統可以收集額外的資料。並利用這些資料,訓練目前的人工智慧系統,使其達到更高的控制水平。

新的雲端計算服務

當各大網路巨頭,將深度學習技術推廣到自己的產品中的相關服務的同時,它們也正在將深度學習推廣給公眾。在2015年年底,谷歌開源了TensorFlow專案,在過去一年,這個一度私有的軟體平臺的傳播遠遠超出了公司層面的範疇。例如像AmandaHodgson這樣的人也從中受益良多。與此同時,Google,Microsoft和Amazon已經開始通過雲端計算服務平臺,向公眾提供他們的深度學習技術支援。任何程式設計師或公司,都可以使用它們來構建自己的應用程式。人工智慧作為一項服務專案,可能在未來成為這三個網路巨頭的最大業務。

在過去的十二個月中,這個新興的巨大市場,激發了新一輪人工智慧人才爭奪的熱潮。史丹佛大學的李菲菲教授是目前AI研究領域最知名的專家之一。Google在今年聘請她,負責一個專門用於人工智慧的新成立的雲端計算部門。同時,亞馬遜委任卡內基梅隆大學的教授Alex Smolna,在其雲服務帝國中扮演重要角色。這些巨頭們正在儘可能快地抓住世界頂尖的AI人才,不給別人任何機會。對於普通人來說,在這個過程中,這些巨頭挖來的人才,會努力與其他人分享一些他們開發的結果技術。

隨著人工智慧的演變發展,電腦科學家的角色正在改變。當然,世界仍然需要能夠開發軟體的人。但越來越多的實際場景,也會需要人們具備訓練神經網路模型——這一獨特的技能。而這一技能更多地需要“誘導“資料,而不是憑藉自己的經驗知識建立模型。像谷歌和Facebook這樣的公司不僅僱用了這樣的新型人才,而且還為他們現有的員工重新描繪了新的未來 ——在未來,人工智慧將會在每個人的生活中重新定義技術。



相關文章