人工智慧已到瓶頸！院士“聯名”反深度學習，並指出AI未來發展方向

演算法與數學之美發表於2018-12-02

原文網址 : https://blog.csdn.net/fnqtyr45/article/details/84749844

針對當下深度學習的技術瓶頸，包括清華大學張鈸在內的多位院士、教授給出了自己的研究思路。

前言

在剛剛結束的CCF-GAIR大會上，來自清華、加州大學伯克利、史丹佛、哈工大等多所國內外頂級理工科院校的院士齊聚深圳，分享了自己最新的研究。雖然各自研究的細分領域有所不同，但是透過貫穿始終的技術講演，避不開的事實是，多位院士都在或直接或間接的去“批判”深度學習演算法。

演講中，他們再次明確指出深度學習的缺陷，進而點出，在可以預見的未來裡，隨著研究的推進，當下的深度學習演算法將會逐步被拉下神壇。

不過，順著學術界走入產業應用，會發現產業界的關注重點是在技術的落地。所謂落地，本質上就是無數應用場景的聚合。所以對於AI企業而言，對業務的探索和用恰當的技術去解決實際問題才是首當其衝的。

因此，深度學習存在缺陷，這一問題短期內並不會妨礙AI當下不可阻擋的發展之勢，技術的侷限也不意味著AI公司們將會無事可做。

但陽春白雪的研究始終引領著AI產業的技術走向，也是企業盈利和產業變革的關鍵驅動力。

所以，在深度學習被過度炒熱的當下，我們理應試著站在院士們的“肩膀”上，看的更遠。而企業家們在腳踏實地的同時，也應當不忘仰望星空。

儘管這已不是什麼新鮮的話題，但是行業內一直沒有可以解決問題的辦法。本文旨在傳達學術界研究者們提供的一些新思路。

機器學習的弊病

源於對“大”的誤解

當下，最常被提起的名詞就是機器學習、深度學習和神經網路，用數學上集合裡的概念去理解這三者之間的聯絡，他們之間依次是包含的關係，即機器學習包含深度學習，深度學習包含神經網路。其中，四層以上的神經網路就可以稱之為深度學習，而深度學習是一種典型的機器學習。

上世紀五十年代，神經網路這一演算法結構出現，當時，它的正式名稱應叫做感知機，但已經包含了輸入層、隱含層和輸出層這一經典的通用結構，並且隨著隱含層層數的加深，對事情的描述就愈加精準。

但是，神經網路是一種以輸入為導向的演算法，所以優質的結果一定取決於接近“無窮”量級的資料。因而，在2000年網際網路革命沒有爆發之前，它一直都處在無人問津的階段。

正如大家所知道的，網際網路時代積累的大量資料和雲端計算帶來的算力的大幅提升，極大地釋放了深度學習演算法（深層的神經網路）的潛力，因而也讓人工智慧時代全面爆發，產業應用得以蓬勃發展。資料顯示，2017年我國人工智慧市場規模達到216.9億元，同比增長52.8%，預計2018年市場規模將達到339億元。

然而，隨著產業應用的成熟，以及大家對真正“智慧”的渴求，讓算力和深度學習演算法本身的侷限性，顯露無疑。

640?wx_fmt=jpeg

圖 | 加州大學伯克利分校電子工程與計算機系教授馬毅

“老百姓概念裡的‘大資料’和我們所認為的大資料是完全不一樣的，就拿影象處理來說，數十億的資料量看似量級很高，但對我們來說，它其實是‘小樣本’。因為真正能夠訓練出好的模型的資料量，應當是趨於無窮的，所以即便是擁有了大量資料去訓練模型，和理想的智慧模型之間，也有著本質的差別。”從演算法性質出發，加州大學伯克利分校電子工程與計算機系教授馬毅也點出了當下這項火熱技術的侷限性。

因而從學者、投資人到AI頭部企業，尋找新的技術和方向成為了現在的重點。

在會議的開場報告中，清華大學張鈸院士呼籲大家思考的“如何走向真正的人工智慧”成為了為期三天會議的基調，同時也反映了行業發展至當下階段，眾人的訴求。

新方向探索

資料處理方法、基本思想和技術思路

資料處理層面，語義向量空間或進一步拓寬入口

看見了技術的“天花板”，很多專家學者開始提出“小資料”的概念，然而清華大學人工智慧學院院長張鈸院士卻不認為資料量的大小是當下的根本問題所在，他指出，傳統的人工智慧三要素將不能帶來真正的智慧。

640?wx_fmt=jpeg

圖 | 清華大學人工智慧學院院長、中國科學院院士張鈸

“評價人工智慧獲得的成果，我們可以從這五件事來看：深藍打敗人類國際象棋冠軍；IBM 在電視知識競賽中打敗了美國的前兩個冠軍；2015 年微軟在ImageNet 上做圖象識別，誤識率略低於人類；百度、訊飛也都宣佈在單句的中文語音識別上識別準確度略低於人類和AlphaGo 打敗了李世石。前兩件事歸為一類，後三件事可歸為另一類。

大家一致認為，這五件事得以發生的三要素是：大資料、算力的提升和非常好的人工智慧演算法。但我認為大家忽略了一項因素，就是這所有的成果必須建立在一個合適的場景下。”

換言之，當下人工智慧的發展避不開種種限制條件，因而智慧的機器也只能夠照章辦事，沒有任何靈活性，也達不到人們想要的智慧，而這也就是當下AI的發展狀態。

“我們現在的人工智慧基本方法有缺陷，而我們必須走向具有理解能力的AI，這才是真正的人工智慧。”張鈸院士在演講中指出。

那解決辦法是什麼呢？通過循序漸進，張院士在演講中給出了思路，並指明語義向量空間這一技術方向。

“首先，需要明確的是，現有的機器缺乏推理能力的原因在於它沒有常識。”

張鈸院士通過實驗驗證，常識的建立確實會極大程度的提升機器的效能。而為機器建立常識庫也成為人工智慧企業進一步提升系統效能的第一步。“美國在1984 年就搞了這樣一個常識庫的工程，做到現在還沒完全做出來。可見，要走向真正的人工智慧，有理解的人工智慧，是一條很漫長的路。”

但即使在建立常識庫的基礎上，做到有理解能力的人工智慧依然不容易。想要提升智慧的第二步，在張院士看來，就是將感性和知識的世界統一起來，而這將為人工智慧的發展帶來一次質的飛躍。

“深度學習之所以能夠極大的促進人工智慧的發展，技術上的關鍵在於人們能夠將獲取的標量資料轉變為向量，從而用到機器上。但至今為止，將行為（特徵向量）和資料（符號向量）結合起來使用始終是科研的難點，而這就限制了機器變得更‘智慧’。”

不僅如此，從安全層面來看，純資料驅動的系統也存在很大問題——魯棒性很差，易受到很大的干擾。因而，在大量樣本的訓練下，系統仍會犯重大的錯誤。如商湯、曠視等頭部企業也表示，即便訓練出的系統模型準確率高達99%，但在實際應用中，系統仍然會犯很多“弱智”的錯誤。

“我們現在想出的解決辦法是這樣的，就是把這特徵向量空間和符號向量投射到一個空間去，這個空間我們把它叫做語義向量空間。”

怎麼做？

張院士指出，第一，要通過Embedding（嵌入）把符號變成向量，儘量保持語義不丟失；第二就是Raising（提升），結合神經學科，把特徵空間提升到語義空間。

“只有解決這些問題，我們才能夠建立一個統一的理論。因為在過去，對感知和認知的處理方法是不同的，因而兩者不在同一維度，無法統一處理。但如果我們能夠將感知和認知投射到同一空間，我們就可以建立一個統一的理論框架，並在語義向量空間裡解決理解問題。這是我們的目標，但是這項工作是非常艱鉅。”

基本思想的顛覆，模糊計算或是未來

“無論是知識圖譜，語義向量空間還是當下的其他深度學習訓練，它們都是基於概率統計理論，而模糊邏輯不是，它是以模糊集理論為基礎的。”非常大膽的，從思想層面，美國猶他州立大學計算機系終身教授承恆達給出了顛覆性的想法。

640?wx_fmt=jpeg

圖 | 美國猶他州立大學計算機系終身教授承恆達

其實模糊邏輯並非全新的概念。1931年，Kurt Gödel發表論文證明了形式數論（即算術邏輯）系統的“不完全性定理”，模糊邏輯誕生。而在1965年，美國加州大學的L.A.Zadeh博士發表的關於模糊集的論文，標誌著人類首次用數學理論成功描述了不確定性。

“現在的計算機領域，不是0就是1，而我們描述的是0到1之間的很多不確定性成分，其實，這一過程描述的是導致結果的原因。以兩瓶水為例，一瓶水上標記‘是純淨水的概率是0.91’，而另一瓶水上標記的是‘水的純淨程度是0.91’，你會選擇哪一瓶呢？顯然，你會選擇後者。這裡的思考判斷過程就是模糊邏輯，因為後者對於程度的描述本質上就是模糊的。”

目前，類似於經典邏輯體系（微積分、線性代數、生物學等衍生學科），模糊邏輯也逐步形成了自己的邏輯體系。

然而再好的技術，都需要結合應用去展現它的優勢。在這一方面，承教授也是格外重視，於是他選擇了乳腺癌的早期診斷研究領域。“到目前為止，我們的設計樣本已經被全世界二十多個國家，五十多個團隊用來使用。”

在承教授看來，現有的技術存在著非常明顯的不足，需要大家沉下心來去分析問題，從而探索到改進的方法。“現在大家都在模擬腦波中的電訊號，但其實大腦裡存在的不僅僅是電訊號，還有化學反應。而很多人在做的醫學影象處理，實際上只是做影象處理，卻不是醫學影象處理，它們之間是有著非常大的不同。”