昨日種種已得獎，那深度學習三巨頭今天在忙什麼？

naojiti發表於2019-04-04

原文網址 : http://blog.itpub.net/31561483/viewspace-2640473/

深度學習

上週，AI圈最大的事情，沒有之一，就是圖靈獎，終於終於，終於頒給了深度學習三巨頭。

關於Geoffrey Hinton和他的兩位學生Yoshua Bengio、Yann LeCun的故事，在訊息出來後的幾天裡，理所當然完成了刷屏。

即使AI從業者和愛好者基本已經對這三位的事蹟耳熟能詳，但他們“高舉著火焰，衝過了最黑暗的時代”的英雄主義情結，還是能夠輕易讓遠離AI世界的人們動容。

“三巨頭”和深度學習的經歷，事實上是一幕從學術邊緣開始，在產業狂歡中自證，再回頭征服主流學術界的故事。起伏線索簡直比好萊塢大片還要好萊塢。

然而現實人生和電影最大的區別或許在於，電影可以在高潮處戛然而止，留給觀眾意味深長的壯美。但生活還要繼續，日子還得過，AI還得發展。深度學習並不會因為圖靈獎的到來而畫上圓滿的句號。

如果說三巨頭在全世界都不相信深度學習時的執拗，最終換來了圖靈獎和一句句“泰斗”的讚美聲;那麼我們今天更應該留意的，或許是在深度學習如日中天的現在，三巨頭又在忙活著什麼?他們現在所忙的，是不是又對映著AI的未來?

我們們不妨換個角度，不說他們可歌可泣的當年，而是聊聊三巨頭的現在。

需要注意的是，這裡並不打算把三人及團隊的每一篇論文都整理出來，而是希望從他們在AI爆發之際的選擇，讀出些許關於深度學習未來走勢與先天不足的底層規律。

Yann LeCun：產學候鳥與AI圈魯迅

三巨頭中最頻繁活躍在大眾視線裡的，是Yann LeCun。

為什麼很多不認識Hinton的人也認識Yann LeCun?這個AI界的未解之謎有很多解釋。

不靠譜的解釋包括，Yann LeCun這個名字非常適合寫成楊麗坤，所以好記。再比如說他的招牌式笑容很容易讓人覺得AI沒那麼枯燥。

而靠譜的解釋是，Yann LeCun是三人中進入產業世界程度最深的那一位，甚至一度被視作AI科學家走向商業世界的代表人物。

2013年，Yann LeCun突然加入Facebook是一件非常有爆炸力的事。大家既不理解Facebook要AI科學家幹嘛，也不明白Yann LeCun去一個社交媒體做什麼。

來到Facebook之後，Yann LeCun一手創立了FAIR。這不是個律師事務所，而是Facebook人工智慧實驗室。

必須要承認，作為FAIR一把手的Yann LeCun，在那幾年間是有不少作為的。比如大幅度提升了Facebook的自動化運營能力，提高了廣告等Facebook生命線的智慧化程度。而另一方面，充滿理想主義精神和學者氣息的Yann LeCun還把FAIR搞成了矽谷最有烏托邦味道的實驗室之一。

在Facebook，FAIR的專家們關注那些天馬行空的前瞻性技術，以及AI如何在未來造福全人類。在祖克伯的默許與支援下，FAIR的紅火甚至一度被認為是矽谷的工程師文化要向科學家文化交槍。

此外，Yann LeCun個人魅力也成為Facebook快速招到頂級科學家的利器，5年中，FAIR擴大到6個辦公地點，有近100名研究員。與吳恩達、李飛飛並列，Yann LeCun也被稱為由學校到企業的三位AI明星之一。

但隨著團隊規模的不斷擴大，Yann LeCun作為理想派科學家，逐漸暴露出了團隊管理能力的不足。加上2017年Facebook風雨飄搖，在整體業務改革之後，業務線開始向FAIR索取更多直接的、有助於提升業務質量或者變現能力的技術——而這並非Yann LeCun所願與所長。

始終保留著紐約大學教職的Yann LeCun，在2018年1月宣佈辭去了FAIR負責人的職務，轉向幕後擔任首席科學家。而這也被外界解讀為一個訊號：似乎和吳恩達、李飛飛一樣，頂級科學家真的不那麼容易在大企業高管的位置上長治久安。

而在產業的探索之外，Yann LeCun的另一個人設，堪稱AI圈裡的魯迅——路見不平一聲twitter，該罵你時候絕不休息。

不少人感覺Yann LeCun有點過於“好作驚人語”，但其實要看到更大的背景在於，今天圍繞著深度學習到底是什麼，未來會怎麼發展，以及AI有沒有用等一系列問題，滋生出了無盡的爭議。

而作為AI行內最大的明星之一，Yann LeCun似乎也在某種程度上有義務出來正本清源。

讓我們們回顧一下讓Yann LeCun啟動開懟模式的三件事：

1、對著名的人形機器人，全球首位“機器公民“索菲亞。Yann LeCun怒斥其為 “徹頭徹尾的騙局”“完全是胡說八道”。在Yann LeCun看來，所謂索菲亞不過是一具放錄音的模型而已，對它的“物體崇拜”會讓人們覺得AI就是在變戲法。真正的AI想要達到嬰兒甚至動物的智商，還要走很遠的路。

2、矽谷鋼鐵俠馬斯克，近兩年的愛好是到處說AI就要毀滅人類了。Yann LeCun認為這種說法非常不負責任。在他看來，馬斯克就是跟一些樂觀派的科學家聊天，又回家看了一些想象成分居多的書，然後就產生了《終結者》馬上要實現的想法。加上眾所周知馬斯克總想拯救人類，最後導致了我們聽到的那些聲音。而在Yann LeCun看來，科學家是知道那種強AI不太可能在幾年內實現的，馬斯克的言論是在散佈恐慌。

3、去年，一位計算機視覺專家Filip Piekniewski連續發表了《深度學習已死》之類的“雄文”，高唱深度學習泡沫要破。Yann LeCun則馬上開啟了回懟模式，直言作者“非常無知”，指出這位作者首先沒有看到學術和產業界的現實，其次用一些無關的證據強行證明AI“寒冬來了”的結論。比如作者提到AI藥丸，一大證據是AI科學家發twitter少了——氣的Yann LeCun趕緊發了一堆twitter。

總結一下，會發現Yann LeCun開懟的主要是三種聲音：假AI、AI威脅論，AI寒冬論。

其實環顧左右，這三種論調是不是也飄散於我們身邊呢?

Yoshua Bengio：保衛象牙塔，鎮守加拿大

說了最高調的，再說說最低調的Yoshua Bengio。

之所以說他低調，是因為Yoshua Bengio可說是三巨頭中最不願意探索產業世界的一位。他在必然出現的重金誘惑面前，也沒有加入那幾家我們耳熟能詳的科技巨頭，而是選擇繼續留在蒙特利爾大學的象牙塔裡，享受著加拿大的好山好水。

然而隨著自己發明的深度學習越來越火，Yoshua Bengio發現事情並不簡單。科技巨頭和投資人開始瘋狂向學校搶人。深度學習方向的博士變成了炙手可熱的香餑餑，直到Yoshua Bengio發現，他還沒畢業的博士都已經被飢渴的科技公司瓜分乾淨。這位科學家決心要保衛象牙塔的純淨。

他的辦法是，自己開一家公司……

咳咳，事實上，Yoshua Bengio是在幾位合夥人的勸說下，決定共同建立一個新型的產學一體化機構。我們知道AI界有著名的OpenAI，專注無不商業目標的開源專案，讓科學家能在企業完成自己的夢想。

而Yoshua Bengio與合夥人聯合創立的Element AI，則反其道而行之。它致力於讓AI科學家們可以直接參與商業專案，獲取相關回報，但同時能夠保留教職——比如每週只用抽出幾個小時來來Element AI幹活，大家一起做做專案賺賺外快就行了。

這種有點像AI科學家線上兼職的模式，可以有效解決一個問題：創業企業和傳統企業，根本無力與科技巨頭爭搶AI人才，但他們卻實打實地需要AI人才來幫忙。這樣一種模式可謂兩全其美。

很快，Element AI就獲得了微軟的投資，現在在深入各行業定製AI解決方案之外，也開始與大公司的聯合科研，以及對優質AI專案進行投資和技術幫助。而對於客戶來說，Yoshua Bengio本人就是商業合作上的金字招牌。

Yoshua Bengio的另一個工作重心，是學校裡的蒙特利爾學習演算法研究所(MILA)。MILA和Element AI一學一產，構成了蒙特利爾AI產業的雙核驅動。今天，加拿大AI的快速發展，以及蒙特利爾被稱為AI時代的矽谷，都與Yoshua Bengio的工作緊密相關。

嗯，至少目前來看，這位象牙塔守護者，加拿大AI之星，還是比較好地完成了任務。

Yoshua Bengio還有一項比較出名的行動，是在AI社會責任與公益領域廣泛擔當呼籲者。比如他帶頭反對谷歌的軍方專案，呼籲終止AI武器化。並且積極推動關注AI中的歧視與不公平問題。

假如給Yoshua Bengio近年來的工作打上三個標籤，那就是：學術的，公益的，加拿大的……

Geoffrey Hinton：懷疑者，依舊懷疑

與兩位50多歲的學生相比，已經72歲的老師Hinton，似乎應該閒下來，享受“AI教父“的尊名，指導指導學生，籌劃一下傳記。

然而事實並非如此，Geoffrey Hinton今天依舊在保持高強度的工作。被腰間盤疾病困擾的他，甚至必須要站著完成所有研究。與兩位學生和大部分功成名就的同行相比，Hinton更像是工作在AI一線的那一個。

簡單來說，那個又倔又橫的小夥子，如今變成了個又倔又橫的老頭。

曾經在一次採訪中，Geoffrey Hinton被問到為什麼能在幾十年的不被重視中堅持下來，他的回答非常酷也非常Hinton。他說：

“他們都錯了。”

直到今天，Hinton還是認為有可能所有人都錯了，包括他自己。

1986年，Hinton發表了《Learning representations by back-propagation errors》，這是Hinton一生的代表作之一，標誌著反向傳播演算法被引進深度學習，今天來看有著跨時代的意義。

然而Hinton在近兩年卻頻頻表示，反向傳播有可能存在這巨大的缺陷。他不但自己嘗試了多種方式突破它，還將大量相關研究綜合起來，寫論文對比如何擺脫反向傳播的窠臼——直到現在，他還沒有超越自己，但並不代表以後不能。

Geoffrey Hinton是一個徹頭徹尾的懷疑者，這點並沒有因為他變成“泰斗”而改變。

在產業世界，Hinton的主要工作在谷歌大腦。近兩年，TensorFlow的簡化升級，谷歌大腦的AI能力擴充，背後都有Hinton與團隊的身影。

而作為“教父”一樣的存在，Hinton更被人關注的是在AI學術領域不斷提出的顛覆性觀點。恰好這又是一個樂於顛覆自己和其他人工作的人。

2017年年底，Hinton發表了名為膠囊網路Capsule Networks的方案，被廣泛認為將改寫深度學習的發展軌跡。

膠囊網路所針對的，是卷積神經網路的操作模式。傳統的深度學習演算法中，每一層神經網路必須做同樣的卷積運算。而膠囊網路則認為，不同的神經元可以攜帶不同屬性，這就像人腦中的不同區域負責不同的工作。

這種將深度學習進行稀疏啟用的顛覆式方案，目前已經被證明可以在影像識別領域達成創新。不少人相信，膠囊網路未來會成為AI可解釋、AI被賦予常識的關鍵技術。

近幾年，Hinton帶來的另一個顛覆，是在暗知識提取dark knowledge extraction領域不間斷的工作。一般來說，深度學習獲取抽象特徵，是建立在龐大的資料運算基礎上的。而這會導致AI必須消耗大量的資料和算力來反覆完成訓練。而暗知識提取，或者叫知識蒸餾，則致力於讓智慧體之間可以提取隱藏的知識，把一部分知識留存到子深度學習系統，最終達成智慧體擺脫龐大的算力與資料渴求，觸及相對先天的“智慧”。

可以看到，Hinton在今天依舊那麼硬核。很多在AI世界看似常識的東西，AI之父卻壓根不相信它，並且在反覆挑戰。

AI走到頭了嗎?深度學習是最終解法嗎?這老頭一輩子從來沒相信過大多數人的判斷。

三巨頭的今天：深度學習，從1到很多

假如說，三巨頭高舉火把，四下無人的那些年，是深度學習從0到1的時代。

那麼今天全世界的深度學習熱，毫無疑問標誌著深度學習開始從1到N。然而從三巨頭今天的工作來看，它也僅僅才到1而已。

不知道大家注意到沒有，三巨頭今天主要關注的方向，恰恰對應著以深度學習為代表的這一次AI復興，所攜帶的先天不足，以及後天激發的問題。把三巨頭的工作強行合併，可以看到這樣幾個方向：

1、AI到底是空談還是事實?解決這個問題，必須把深度學習扔到產業熔爐當中，在算力、資料和應用場景裡，檢驗深度學習到底能幹什麼。而這也是大量AI科學家必須去企業的邏輯之一。

2、AI火了之後，各種亂七八糟的事情一定會出來飛舞，需要有人把火車拉回軌道。Yann LeCun在社交媒體上四面開火就是因為這個。索菲亞的把戲、馬斯克的AI威脅論，以及“AI寒冬又來了”，這幾個說法今天在中國一定有大批擁護者。不難看出問題還是挺尖銳的。

3、AI的人才匹配與平衡問題。這輪AI復興的一個特徵，是高度的產學一體化，導致學術人才可以直接與應用打通。然而學術人才如何在產業誘惑面前保持學術追求，產業如何在巨頭爭搶下獲得AI人才幫助，這個問題在中國同樣存在。

4、深度學習是把雙刃劍，軍事化、歧視與不公、因素安全等問題隨之產生。AI的社會責任，是一個刻不容緩的矛盾。

5、深度學習，不是終點。反向傳播，多層神經網路等等技術模式構成了我們習以為常的那個“AI”。但是深度學習依舊有大量問題存在，比如黑箱性，遷移能力差，高消耗等等。我們是把今天的AI當成原教旨，還是繼續挑戰，尋找更上層的終點?這點Hinton這位“深度學習之父”真是帶了個好頭。

功績當然偉大，問題還有一堆。今天，三巨頭還在工作，他們在為他們的造物負責。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31561483/viewspace-2640473/，如需轉載，請註明出處，否則將追究法律責任。

“深度學習三巨頭”來了倆，Hinton、LeCun預言深度學習的未來
2019-06-28
深度學習LeCun
VIM模式三種模式有什麼？linux系統學習
2020-08-17
模式Linux
深度學習為什麼需要那麼多的資料？
2018-08-30
深度學習
三大深度學習生成模型：VAE、GAN及其變種
2018-09-03
深度學習模型
深度學習中資料集很小是一種什麼樣的體驗
2021-03-01
深度學習
「技術綜述」影象與CNN發家簡史，集齊深度學習三巨頭
2019-07-15
CNN深度學習
深度學習是什麼
2019-12-31
深度學習
學習筆記 ProgressBar三種style 水平兩種寫法
2021-02-20
筆記
扎堆造芯，巨頭拼什麼？
2022-08-01
10.31學習日報三種迴圈
2020-11-02
(Python教程)什麼是機器學習、人工智慧、深度學習，三者又是什麼關係？
2021-08-31
Python機器學習人工智慧深度學習
AUTOCAD——三種箭頭的畫法
2022-02-16
css的三種常用寫法是什麼
2021-09-11
CSS
深度學習二：概率和反向傳播的變種
2020-09-25
深度學習反向傳播
深度學習-TF、keras兩種padding方式：vaild和sam
2019-02-19
深度學習KeraspaddingAI
什麼是 AI、機器學習與深度學習？
2019-01-24
AI機器學習深度學習
什麼是AI、機器學習與深度學習？
2019-01-21
AI機器學習深度學習
學習Python要多久?三種方式學習週期介紹!
2020-09-22
Python
Python二叉樹的三種深度
2021-04-15
Python二叉樹
漫畫版：什麼是深度學習？
2020-03-28
深度學習
TensorFlow、Keras、CNTK...到底哪種深度學習框架更好用？
2018-03-19
Keras深度學習框架
深度學習day1（第一章：什麼是深度學習？）
2020-10-26
深度學習
AI從業者需要應用的10種深度學習方法
2018-09-05
AI深度學習
一種產生 DSN 放大攻擊的深度學習技術
2022-10-11
深度學習
故障診斷為什麼要用深度學習?
2020-08-30
深度學習
什麼是深度學習的影片標註？
2023-01-12
深度學習
Python執行程式常用的三種方法是什麼？
2022-11-02
Python行程
斐波那契數列三種實現函式
2019-02-27
函式
圖靈獎得主Geoffrey Hinton最新研究NASA：一種更好地學習三維模型動作的方法
2019-12-19
圖靈模型
2024年暑期教師研修快速學習方法（三種）
2024-07-23
Python解析引數的三種方法分別是什麼？
2022-08-17
Python
Python 機器學習 HMM模型三種經典問題
2024-03-19
Python機器學習HMM模型
為什麼那麼多人要學Java？這三個原因告訴你
2021-11-16
Java
為什麼那麼多零基礎人員學習Python?
2020-10-12
Python
Linux從頭學07：中斷那麼重要，它的本質到底是什麼？
2021-08-17
Linux
大資料、人工智慧、機器學習與深度學習都是什麼？有什麼關係？
2019-04-15
大資料人工智慧機器學習深度學習
跨界汽車，也許並沒有家電巨頭想得那麼簡單
2023-02-20
為什麼那麼多人要學習go語言?go語言有什麼特點?
2019-11-12
Go

昨日種種已得獎，那深度學習三巨頭今天在忙什麼？

相關文章