昨日種種已得獎,那深度學習三巨頭今天在忙什麼?
上週,AI圈最大的事情,沒有之一,就是圖靈獎,終於終於,終於頒給了深度學習三巨頭。
關於Geoffrey Hinton和他的兩位學生Yoshua Bengio、Yann LeCun的故事,在訊息出來後的幾天裡,理所當然完成了刷屏。
即使AI從業者和愛好者基本已經對這三位的事蹟耳熟能詳,但他們“高舉著火焰,衝過了最黑暗的時代”的英雄主義情結,還是能夠輕易讓遠離AI世界的人們動容。
“三巨頭”和深度學習的經歷,事實上是一幕從學術邊緣開始,在產業狂歡中自證,再回頭征服主流學術界的故事。起伏線索簡直比好萊塢大片還要好萊塢。
然而現實人生和電影最大的區別或許在於,電影可以在高潮處戛然而止,留給觀眾意味深長的壯美。但生活還要繼續,日子還得過,AI還得發展。深度學習並不會因為圖靈獎的到來而畫上圓滿的句號。
如果說三巨頭在全世界都不相信深度學習時的執拗,最終換來了圖靈獎和一句句“泰斗”的讚美聲;那麼我們今天更應該留意的,或許是在深度學習如日中天的現在,三巨頭又在忙活著什麼?他們現在所忙的,是不是又對映著AI的未來?
我們們不妨換個角度,不說他們可歌可泣的當年,而是聊聊三巨頭的現在。
需要注意的是,這裡並不打算把三人及團隊的每一篇論文都整理出來,而是希望從他們在AI爆發之際的選擇,讀出些許關於深度學習未來走勢與先天不足的底層規律。
Yann LeCun:產學候鳥與AI圈魯迅
三巨頭中最頻繁活躍在大眾視線裡的,是Yann LeCun。
為什麼很多不認識Hinton的人也認識Yann LeCun?這個AI界的未解之謎有很多解釋。
不靠譜的解釋包括,Yann LeCun這個名字非常適合寫成楊麗坤,所以好記。再比如說他的招牌式笑容很容易讓人覺得AI沒那麼枯燥。
而靠譜的解釋是,Yann LeCun是三人中進入產業世界程度最深的那一位,甚至一度被視作AI科學家走向商業世界的代表人物。
2013年,Yann LeCun突然加入Facebook是一件非常有爆炸力的事。大家既不理解Facebook要AI科學家幹嘛,也不明白Yann LeCun去一個社交媒體做什麼。
來到Facebook之後,Yann LeCun一手創立了FAIR。這不是個律師事務所,而是Facebook人工智慧實驗室。
必須要承認,作為FAIR一把手的Yann LeCun,在那幾年間是有不少作為的。比如大幅度提升了Facebook的自動化運營能力,提高了廣告等Facebook生命線的智慧化程度。而另一方面,充滿理想主義精神和學者氣息的Yann LeCun還把FAIR搞成了矽谷最有烏托邦味道的實驗室之一。
在Facebook,FAIR的專家們關注那些天馬行空的前瞻性技術,以及AI如何在未來造福全人類。在祖克伯的默許與支援下,FAIR的紅火甚至一度被認為是矽谷的工程師文化要向科學家文化交槍。
此外,Yann LeCun個人魅力也成為Facebook快速招到頂級科學家的利器,5年中,FAIR擴大到6個辦公地點,有近100名研究員。與吳恩達、李飛飛並列,Yann LeCun也被稱為由學校到企業的三位AI明星之一。
但隨著團隊規模的不斷擴大,Yann LeCun作為理想派科學家,逐漸暴露出了團隊管理能力的不足。加上2017年Facebook風雨飄搖,在整體業務改革之後,業務線開始向FAIR索取更多直接的、有助於提升業務質量或者變現能力的技術——而這並非Yann LeCun所願與所長。
始終保留著紐約大學教職的Yann LeCun,在2018年1月宣佈辭去了FAIR負責人的職務,轉向幕後擔任首席科學家。而這也被外界解讀為一個訊號:似乎和吳恩達、李飛飛一樣,頂級科學家真的不那麼容易在大企業高管的位置上長治久安。
而在產業的探索之外,Yann LeCun的另一個人設,堪稱AI圈裡的魯迅——路見不平一聲twitter,該罵你時候絕不休息。
不少人感覺Yann LeCun有點過於“好作驚人語”,但其實要看到更大的背景在於,今天圍繞著深度學習到底是什麼,未來會怎麼發展,以及AI有沒有用等一系列問題,滋生出了無盡的爭議。
而作為AI行內最大的明星之一,Yann LeCun似乎也在某種程度上有義務出來正本清源。
讓我們們回顧一下讓Yann LeCun啟動開懟模式的三件事:
1、對著名的人形機器人,全球首位“機器公民“索菲亞。Yann LeCun怒斥其為 “徹頭徹尾的騙局”“完全是胡說八道”。在Yann LeCun看來,所謂索菲亞不過是一具放錄音的模型而已,對它的“物體崇拜”會讓人們覺得AI就是在變戲法。真正的AI想要達到嬰兒甚至動物的智商,還要走很遠的路。
2、矽谷鋼鐵俠馬斯克,近兩年的愛好是到處說AI就要毀滅人類了。Yann LeCun認為這種說法非常不負責任。在他看來,馬斯克就是跟一些樂觀派的科學家聊天,又回家看了一些想象成分居多的書,然後就產生了《終結者》馬上要實現的想法。加上眾所周知馬斯克總想拯救人類,最後導致了我們聽到的那些聲音。而在Yann LeCun看來,科學家是知道那種強AI不太可能在幾年內實現的,馬斯克的言論是在散佈恐慌。
3、去年,一位計算機視覺專家Filip Piekniewski連續發表了《深度學習已死》之類的“雄文”,高唱深度學習泡沫要破。Yann LeCun則馬上開啟了回懟模式,直言作者“非常無知”,指出這位作者首先沒有看到學術和產業界的現實,其次用一些無關的證據強行證明AI“寒冬來了”的結論。比如作者提到AI藥丸,一大證據是AI科學家發twitter少了——氣的Yann LeCun趕緊發了一堆twitter。
總結一下,會發現Yann LeCun開懟的主要是三種聲音:假AI、AI威脅論,AI寒冬論。
其實環顧左右,這三種論調是不是也飄散於我們身邊呢?
Yoshua Bengio:保衛象牙塔,鎮守加拿大
說了最高調的,再說說最低調的Yoshua Bengio。
之所以說他低調,是因為Yoshua Bengio可說是三巨頭中最不願意探索產業世界的一位。他在必然出現的重金誘惑面前,也沒有加入那幾家我們耳熟能詳的科技巨頭,而是選擇繼續留在蒙特利爾大學的象牙塔裡,享受著加拿大的好山好水。
然而隨著自己發明的深度學習越來越火,Yoshua Bengio發現事情並不簡單。科技巨頭和投資人開始瘋狂向學校搶人。深度學習方向的博士變成了炙手可熱的香餑餑,直到Yoshua Bengio發現,他還沒畢業的博士都已經被飢渴的科技公司瓜分乾淨。這位科學家決心要保衛象牙塔的純淨。
他的辦法是,自己開一家公司……
咳咳,事實上,Yoshua Bengio是在幾位合夥人的勸說下,決定共同建立一個新型的產學一體化機構。我們知道AI界有著名的OpenAI,專注無不商業目標的開源專案,讓科學家能在企業完成自己的夢想。
而Yoshua Bengio與合夥人聯合創立的Element AI,則反其道而行之。它致力於讓AI科學家們可以直接參與商業專案,獲取相關回報,但同時能夠保留教職——比如每週只用抽出幾個小時來來Element AI幹活,大家一起做做專案賺賺外快就行了。
這種有點像AI科學家線上兼職的模式,可以有效解決一個問題:創業企業和傳統企業,根本無力與科技巨頭爭搶AI人才,但他們卻實打實地需要AI人才來幫忙。這樣一種模式可謂兩全其美。
很快,Element AI就獲得了微軟的投資,現在在深入各行業定製AI解決方案之外,也開始與大公司的聯合科研,以及對優質AI專案進行投資和技術幫助。而對於客戶來說,Yoshua Bengio本人就是商業合作上的金字招牌。
Yoshua Bengio的另一個工作重心,是學校裡的蒙特利爾學習演算法研究所(MILA)。MILA和Element AI一學一產,構成了蒙特利爾AI產業的雙核驅動。今天,加拿大AI的快速發展,以及蒙特利爾被稱為AI時代的矽谷,都與Yoshua Bengio的工作緊密相關。
嗯,至少目前來看,這位象牙塔守護者,加拿大AI之星,還是比較好地完成了任務。
Yoshua Bengio還有一項比較出名的行動,是在AI社會責任與公益領域廣泛擔當呼籲者。比如他帶頭反對谷歌的軍方專案,呼籲終止AI武器化。並且積極推動關注AI中的歧視與不公平問題。
假如給Yoshua Bengio近年來的工作打上三個標籤,那就是:學術的,公益的,加拿大的……
Geoffrey Hinton:懷疑者,依舊懷疑
與兩位50多歲的學生相比,已經72歲的老師Hinton,似乎應該閒下來,享受“AI教父“的尊名,指導指導學生,籌劃一下傳記。
然而事實並非如此,Geoffrey Hinton今天依舊在保持高強度的工作。被腰間盤疾病困擾的他,甚至必須要站著完成所有研究。與兩位學生和大部分功成名就的同行相比,Hinton更像是工作在AI一線的那一個。
簡單來說,那個又倔又橫的小夥子,如今變成了個又倔又橫的老頭。
曾經在一次採訪中,Geoffrey Hinton被問到為什麼能在幾十年的不被重視中堅持下來,他的回答非常酷也非常Hinton。他說:
“他們都錯了。”
直到今天,Hinton還是認為有可能所有人都錯了,包括他自己。
1986年,Hinton發表了《Learning representations by back-propagation errors》,這是Hinton一生的代表作之一,標誌著反向傳播演算法被引進深度學習,今天來看有著跨時代的意義。
然而Hinton在近兩年卻頻頻表示,反向傳播有可能存在這巨大的缺陷。他不但自己嘗試了多種方式突破它,還將大量相關研究綜合起來,寫論文對比如何擺脫反向傳播的窠臼——直到現在,他還沒有超越自己,但並不代表以後不能。
Geoffrey Hinton是一個徹頭徹尾的懷疑者,這點並沒有因為他變成“泰斗”而改變。
在產業世界,Hinton的主要工作在谷歌大腦。近兩年,TensorFlow的簡化升級,谷歌大腦的AI能力擴充,背後都有Hinton與團隊的身影。
而作為“教父”一樣的存在,Hinton更被人關注的是在AI學術領域不斷提出的顛覆性觀點。恰好這又是一個樂於顛覆自己和其他人工作的人。
2017年年底,Hinton發表了名為膠囊網路Capsule Networks的方案,被廣泛認為將改寫深度學習的發展軌跡。
膠囊網路所針對的,是卷積神經網路的操作模式。傳統的深度學習演算法中,每一層神經網路必須做同樣的卷積運算。而膠囊網路則認為,不同的神經元可以攜帶不同屬性,這就像人腦中的不同區域負責不同的工作。
這種將深度學習進行稀疏啟用的顛覆式方案,目前已經被證明可以在影像識別領域達成創新。不少人相信,膠囊網路未來會成為AI可解釋、AI被賦予常識的關鍵技術。
近幾年,Hinton帶來的另一個顛覆,是在暗知識提取dark knowledge extraction領域不間斷的工作。一般來說,深度學習獲取抽象特徵,是建立在龐大的資料運算基礎上的。而這會導致AI必須消耗大量的資料和算力來反覆完成訓練。而暗知識提取,或者叫知識蒸餾,則致力於讓智慧體之間可以提取隱藏的知識,把一部分知識留存到子深度學習系統,最終達成智慧體擺脫龐大的算力與資料渴求,觸及相對先天的“智慧”。
可以看到,Hinton在今天依舊那麼硬核。很多在AI世界看似常識的東西,AI之父卻壓根不相信它,並且在反覆挑戰。
AI走到頭了嗎?深度學習是最終解法嗎?這老頭一輩子從來沒相信過大多數人的判斷。
三巨頭的今天:深度學習,從1到很多
假如說,三巨頭高舉火把,四下無人的那些年,是深度學習從0到1的時代。
那麼今天全世界的深度學習熱, 毫無疑問標誌著深度學習開始從1到N。然而從三巨頭今天的工作來看,它也僅僅才到1而已。
不知道大家注意到沒有,三巨頭今天主要關注的方向,恰恰對應著以深度學習為代表的這一次AI復興,所攜帶的先天不足,以及後天激發的問題。把三巨頭的工作強行合併,可以看到這樣幾個方向:
1、AI到底是空談還是事實?解決這個問題,必須把深度學習扔到產業熔爐當中,在算力、資料和應用場景裡,檢驗深度學習到底能幹什麼。而這也是大量AI科學家必須去企業的邏輯之一。
2、AI火了之後,各種亂七八糟的事情一定會出來飛舞,需要有人把火車拉回軌道。Yann LeCun在社交媒體上四面開火就是因為這個。索菲亞的把戲、馬斯克的AI威脅論,以及“AI寒冬又來了”,這幾個說法今天在中國一定有大批擁護者。不難看出問題還是挺尖銳的。
3、AI的人才匹配與平衡問題。這輪AI復興的一個特徵,是高度的產學一體化,導致學術人才可以直接與應用打通。然而學術人才如何在產業誘惑面前保持學術追求,產業如何在巨頭爭搶下獲得AI人才幫助,這個問題在中國同樣存在。
4、深度學習是把雙刃劍,軍事化、歧視與不公、因素安全等問題隨之產生。AI的社會責任,是一個刻不容緩的矛盾。
5、深度學習,不是終點。反向傳播,多層神經網路等等技術模式構成了我們習以為常的那個“AI”。但是深度學習依舊有大量問題存在,比如黑箱性,遷移能力差,高消耗等等。我們是把今天的AI當成原教旨,還是繼續挑戰,尋找更上層的終點?這點Hinton這位“深度學習之父”真是帶了個好頭。
功績當然偉大,問題還有一堆。今天,三巨頭還在工作,他們在為他們的造物負責。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2640473/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- “深度學習三巨頭”來了倆,Hinton、LeCun預言深度學習的未來深度學習LeCun
- VIM模式三種模式有什麼?linux系統學習模式Linux
- 深度學習為什麼需要那麼多的資料?深度學習
- 三大深度學習生成模型:VAE、GAN及其變種深度學習模型
- 深度學習中資料集很小是一種什麼樣的體驗深度學習
- 「技術綜述」影象與CNN發家簡史,集齊深度學習三巨頭CNN深度學習
- 深度學習是什麼深度學習
- 學習筆記 ProgressBar三種style 水平兩種寫法筆記
- 扎堆造芯,巨頭拼什麼?
- 10.31學習日報 三種迴圈
- (Python教程)什麼是機器學習、人工智慧、深度學習,三者又是什麼關係?Python機器學習人工智慧深度學習
- AUTOCAD——三種箭頭的畫法
- css的三種常用寫法是什麼CSS
- 深度學習二:概率和反向傳播的變種深度學習反向傳播
- 深度學習-TF、keras兩種padding方式:vaild和sam深度學習KeraspaddingAI
- 什麼是 AI、機器學習與深度學習?AI機器學習深度學習
- 什麼是AI、機器學習與深度學習?AI機器學習深度學習
- 學習Python要多久?三種方式學習週期介紹!Python
- Python二叉樹的三種深度Python二叉樹
- 漫畫版:什麼是深度學習?深度學習
- TensorFlow、Keras、CNTK...到底哪種深度學習框架更好用?Keras深度學習框架
- 深度學習day1(第一章:什麼是深度學習?)深度學習
- AI從業者需要應用的10種深度學習方法AI深度學習
- 一種產生 DSN 放大攻擊的深度學習技術深度學習
- 故障診斷為什麼要用深度學習?深度學習
- 什麼是深度學習的影片標註?深度學習
- Python執行程式常用的三種方法是什麼?Python行程
- 斐波那契數列三種實現函式函式
- 圖靈獎得主Geoffrey Hinton最新研究NASA:一種更好地學習三維模型動作的方法圖靈模型
- 2024年暑期教師研修快速學習方法(三種)
- Python解析引數的三種方法分別是什麼?Python
- Python 機器學習 HMM模型三種經典問題Python機器學習HMM模型
- 為什麼那麼多人要學Java?這三個原因告訴你Java
- 為什麼那麼多零基礎人員學習Python?Python
- Linux從頭學07:中斷那麼重要,它的本質到底是什麼?Linux
- 大資料、人工智慧、機器學習與深度學習都是什麼?有什麼關係?大資料人工智慧機器學習深度學習
- 跨界汽車,也許並沒有家電巨頭想得那麼簡單
- 為什麼那麼多人要學習go語言?go語言有什麼特點?Go