Yann LeCun撰文解讀:人工智慧未來的機會在哪裡?

機器之心發表於2016-12-02

幾個小時前,Facebook 人工智慧研究實驗室主管 Yann LeCun 和 Facebook 應用機器學習部門主管 Joaquin Quiñonero Candela 在 Facebook Code 部落格上發表了一篇題為《Artificial intelligence, revealed》的文章,介紹了人工智慧的一些基本概念和能力,並討論了相關應用和研究上的未來前景。除此之外,本文還包含了三段簡潔直觀的演示影片,其中兩段更是由 Yann LeCun 親自解說的。如果你是一名學生,你還能在這篇文章中看到一些有用的建議。此外,你也可以看看機器之心整理 Yann LeCun 在Quora上的問答,裡面也有很多不錯的建議。

現在是早上週二早上八點。你已經醒了,瀏覽手機頭條新聞,回覆 po 文,為老媽訂購毛衫,鎖門,開車上班,一路聽著收音機裡的美妙音樂

此時,你已經使用人工智慧不下十幾次了——被喚醒、早間地方天氣預報、購買禮物、鎖門、注意即將到來的堵車、甚至識別一首還不熟悉的歌曲。人工智慧已經滲透進我們的生活,日常生活發生大不同。但是,這並非你在科幻電影裡看到的人工智慧(神經兮兮的科學家噼啪敲打鍵盤,試著阻止人工智慧摧毀世界)。你的智慧手機、房屋、銀行和汽車每天都會用到人工智慧。有時你感受到你在使用人工智慧,比如當你請 Siri 導航到最近的氣站時,或者 Facebook 根據你貼出的一張圖片為您推薦好友時。有時你就感覺不到,比如,當你要求 Amazon Echo 用你的信用卡進行一次不尋常的購物時(比如愚蠢的節日毛衫),銀行並沒有發出欺詐警告。

自動駕駛汽車、醫學影像分析、更好的醫療診斷以及個性化醫療,人工智慧會為這個社會帶來很多變化。未來,它還會帶來很多極具創造力的應用以及服務。但是,對於許多人來說,它仍然顯得神秘莫測。

為了揭開部分神秘之處,Facebook 正在建立一系列線上教育影片,介紹人工智慧如何運作。我們希望這些簡單精煉的介紹會幫助每個人瞭解這一電腦科學中的複雜領域是如何運作的。

沒有魔法,程式碼而已

首先你需要知道一些重要的內容:人工智慧是一門使用演算法技術設計智慧系統和機器的嚴謹科學,而這種演算法技術的靈感某種程度上源自我們對大腦的瞭解。許多現代人工智慧系統使用了人工神經網路,一種計算機程式碼,它能模擬出由非常簡單的互聯單元構成的大型網路,這有點像大腦神經元構成。這些網路透過修改單元之間的連線而不斷從經驗中學習,就像人類和動物的大腦不斷變化神經元之間的連線進行學習。現代神經網路能夠學會模式識別、翻譯、簡單的邏輯推理,甚至可以創造影像和形成新的想法,模式識別尤為重要——人工智慧善於識別海量資料中的模式,對於人類來說,這可不是簡單的事。

透過專門用來執行有著數百萬單元和數十億連結的神經網路的一套編碼程式,所有這些都能以眼花繚亂的速度發生著。在海量簡單元素的互動過程中,智慧出現了。人工智慧不是魔法,但是我們已經看到了它能使科學研究研究領域取得魔法般的進步,它們能識別照片裡的物體、識別語音、駕駛汽車或者將線上文章翻譯成多種語言,每天都給我們帶來一些奇蹟。

在 FAIR 實驗室,我們正在研究如何讓機器更好地工作,大部分工作內容就是深度學習,亦即如何透過搭建多個處理層的神經網路來增強人工智慧。透過使用深度學習,我們可以幫助人工智慧學會提取世界的表徵。深度學習能有助於改善語音、物體識別之類的活動,在推進諸如物理學、工程學和醫學等多種科學領域的研究中,也扮演者重要角色。

一種特別有用的深度學習系統架構是卷積神經網路(CNN 或 ConvNet),它是一種連線神經網路單元的特殊方式,其靈感來自動物和人類的視覺皮層結構。現代的 ConvNet 可以少至七層、多至百層。在公園裡我們人類在看見一隻柯利牧羊犬或一隻吉娃娃時都能夠將它們識別為狗,儘管它們大小和體重都不同。對於計算機來說,一張圖片不過是一列數字而已。在這一數字行列中,目標物體的邊緣等區域性模體(local motif)在第一層就能被輕易檢測到。接下來的那一層將識別出這些構成簡單形狀的簡單模體(simple motif)的組合,比如車輪或眼部。最後一層將會識別這些組合的進一步組合:一輛車、一架飛機、一個人、一隻狗等等。網路的深度——多層——能夠讓它以這樣的層級方式識別複雜模式。

只要有巨大的樣本庫來進行訓練,CNN 在識別影像、影片、音樂甚至文字等自然訊號上就會特別有用。為了訓練出一個良好的神經網路,你需要提供大量經過了人類標註的影像。卷積神經網路能夠學會將每一張影像與其對應的標籤關聯起來。而讓我們感興趣的地方是它還能夠生成其之前從未見過的標籤。最終我們能得到一個能梳理大量不同 影像並識別圖片內容的系統。在語音識別和文字識別上,這些網路也特別有用,也是自動駕駛汽車以及最新一代的醫療影像分析系統的關鍵組成部分。

什麼是可學習的?

人工智慧也解決了人類所面臨的核心問題之一:什麼是智慧?哲學家和科學家們一直在努力解決這個問題。但其答案一直是難以捉摸而又玄之又玄的,然而正是因為這個重要的特性才使得我們成為獨一無二的人類。

同時,人工智慧也揭露出一個大的哲學和理論性的問題:什麼是可學習的(learnable)?因為數學定理告訴我們單個的學習機器不能有效地學習所有可能的任務,那麼我們就會感到:不管你投入多少資源,總是有東西不能被學習。

在這個方面,人工智慧機器和人類非常類似。我們不總是擅長學習。儘管我們的大腦有明顯的適應性,但是它們有著非常強的專業性。而當代的人工智慧系統還遠遠不具有人類所擁有的看似通用的智慧。

在人工智慧方面,我們一般考慮學習的 3 種型別:

強化學習(Reinforcement learning)——這是一個關於代理機制如何行動以實現回報最大化的問題,它的靈感來自於行為主義心理學(behaviorist psychology)。在一個特定情形中,機器執行一個或者一系列動作,並且得到回報。這通常用於教機器玩遊戲和贏得比賽,比如,國際象棋、西洋雙陸棋、圍棋或者簡單的影片遊戲。其中的一個問題在於,在其最初始的形式中,強化學習需要極多的試驗才能學會一個簡單的任務。

監督學習(Supervised learning)——一般來說,對於特定的輸入,我們告訴機器相應的正確答案。比如對於一張汽車的影像,我們還會給出相應的正確答案「汽車」。它被稱為監督學習,因為演算法從被標記的訓練資料集中學習的過程類似於向一個年幼的孩子展示一本圖畫書。成年人知道正確答案,孩子們則依據先前的例子來進行猜測。這是訓練神經網路和其他機器學習架構常見的技術。比如,根據你的城鎮的大量的房屋價格的描述,嘗試預測你自己房子的售價。

無監督學習/預測學習(Unsupervised learning / predictive learning)——大部分人類和動物都是在他們生命中的前幾個小時、幾天、幾個月和幾年的時間中以無人監督的方式學習:我們透過觀察周圍環境以及認識到我們的動作所造成影響來了解世界運轉的規律。沒有人告訴來告訴我們那些我們觀察到的每一個事物的名字和功能。我們可以學習到非常基本的概念,比如,世界是三維的、物體不會憑空消失、沒有支撐的東西會掉落。如今,我們還不知道如何讓機器來學習這樣的一些事情,至少機器不能做到人類和動物可以做到的這些事情。我們缺乏用於無監督或預測學習的人工智慧技術,這是限制當前人工智慧發展的因素之一。

這些方法經常在人工智慧領域中使用,但是在計算裝置方面仍然存在很多問題。這就是為什麼即使我們造出了了超人(superhuman)的智慧機器,它們的能力仍然是有限的——它們可能下棋能贏我們,但是卻還沒有聰明到知道怎麼躲雨。

未來的工作

隨著人工智慧、機器學習和智慧機器人變得越來越普遍,在製造、培訓、銷售、維護和團隊管理方面,將出現新的工作需求。人工智慧和機器人能夠創造出今天難以想象的嶄新服務。不過,第一批因人工智慧技術而徹底轉型的行業當中,顯然會有醫療保健和運輸業。

對年輕人來說,人工智慧會提供大量的工作機會。所以,我們如何為尚不存在的工作做準備呢?

如果你是一名學生:

  • 數學和物理課程可以學到人工智慧,機器學習,資料科學以及未來許多工作所需的基礎知識。學習所有可以學的數學課程,包括 Calc I,Calc II,Calc III,線性代數,機率與統計,同時電腦科學也必不可少——你需要學習如何程式設計。工學,經濟學和神經科學也很有用。你還可以考慮一些哲學領域的課程,例如認識論——這是一門研究什麼是知識,什麼是科學理論以及何為學習的學科。

  • 學習這些課程的目的不是簡單的死記硬背,學生必須學會如何將資料轉化為知識。這包括基本統計,如何收集和分析資料,注意到可能的偏見,並對透過偏見資料操作來防止自欺的技巧保持警惕。

  • 你可以在學校請教一位教授來幫助你將想法具體化,如果他們時間有限,你也可以尋找高年級的博士生或博士後合作。

  • 申請博士課程吧。現在請忘記學校「排名」,找到一位研究你感興趣的課題的受尊重的教授,或選擇一個你認為寫論文質量很高的人。去申請這些教授所在的學校的博士課程,並記得在信中提到你想與該教授合作,同時也可與他人合作。

  • 投入你感興趣的人工智慧有關問題並開始閱讀有關文獻,嘗試用不同的方式思考。在畢業之前,嘗試寫一篇關於你的研究的文章或者釋出一個開原始碼。

  • 申請有關行業的實習,從實踐中親身獲取人工智慧工作原理方面的經驗。

如果你已經有了工作但想要轉行:

  • 透過線上提供的教程,你可以瞭解深度學習的概念。網上有很多的線上材料,教程和機器學習課程,包括 Udacity 和 Coursera 講座。包括發表在 Nature 上的綜述,作者是我、Yoshua Bengio 和 Geoff Hinton,還有很多指向這篇綜述的文章《Deep Learning》,Goodfellow,Bengio 和 Courville 的深度學習教材,以及我最近在巴黎的法蘭西學院開展的關於深度學習的 8 個講座(法語教授,後來已有英譯版本)也很有用。

  • 如果你想返校深造,請參考上文。

關於未來

越來越多的人類腦力活動將與智慧機器關聯起來。人之為人,便是因為擁有智慧;而人工智慧便是智慧的延伸。

在建設真正智慧機器的征途中,我們正在發現可應用並將改善我們今天、明天、明年日常生活的新理論,原則,方法與演算法。這些技術中,有許多已經很快找到了應用到 Facebook 的產品和服務中的途徑,如影像理解,自然語言理解等。

談到在 Facebook 的人工智慧時,我們有一個長期目標:即瞭解智慧並構建智慧機器。這不僅僅是一個技術挑戰,還是一個科學問題。什麼是智力?我們該如何在機器中將其再現?這仍是人類所探尋的問題。這些問題的答案不僅會對建立智慧機器有所幫助,也讓我們更加洞見神秘人類意識與大腦的工作方式。但願它將能夠幫助我們更好地理解生而為人的意義。

相關文章