張鈸院士:人工智慧技術已進入第三代

dicksonjyl560101發表於2019-06-09

https://blog.csdn.net/cf2SudS8x8F0v/article/details/90986936


640?wx_fmt=jpeg

來源:經濟觀察報


近日,中科院院士、清華大學人工智慧研究院院長張鈸教授接受記者採訪時認為,目前基於深度學習的人工智慧在技術上已經觸及天花板。從長遠來看,必須得走人類智慧這條路,最終要發展人機協同,人類和機器和諧共處的世界。未來需要建立可解釋、魯棒性的人工智慧理論和方法,發展安全、可靠和可信的人工智慧技術。

640?wx_fmt=jpeg

張鈸院士:AI奇蹟短期難再現 深度學習技術潛力已近天花板


在Alphago與韓國圍棋選手李世石對戰獲勝三年過後,一些跡象逐漸顯現,張鈸院士認為到了一個合適的時點,並接受了此次的專訪。


深度學習目前人工智慧最受關注的領域,但並不是人工智慧研究的全部。張鈸認為儘管產業層面還有空間,但目前基於深度學習的人工智慧在技術上已經觸及天花板,此前由這一技術路線帶來的“奇蹟”在Alphago獲勝後未再出現,而且估計未來也很難繼續大量出現。技術改良很難徹底解決目前階段人工智慧的根本性缺陷,而這些缺陷決定了其應用的空間被侷限在特定的領域——大部分都集中在影象識別、語音識別兩方面。


同時,在張鈸看來,目前全世界的企業界和部分學界對於深度學習技術的判斷過於樂觀,人工智慧迫切需要推動到新的階段,而這注定將會是一個漫長的過程,有賴於與數學、腦科學等結合實現底層理論的突破。


作為中國少有的經歷了兩個人工智慧技術階段的研究者,張鈸在過去數年鮮少接受採訪,其中一個原因在於他對目前人工智慧技術發展現狀的估計持有部分不同看法,在時機未到之時,張鈸謹慎的認為這些看法並不方便通過大眾媒體進行傳播,即使傳播也很難獲得認同。


一、“奇蹟並沒有發生,按照我的估計,也不會繼續大量發生”


經濟觀察報:您是如何估計和評價目前人工智慧發展的現狀?


張鈸: 這一輪人工智慧熱潮是本世紀初興起的。首先是出現在學術界。學術界過去對人工智慧是冷遇的,但是多層神經網路的出現帶來了一些改變,神經網路的理論在上世紀50年代就有了,但是一直處於淺層的應用狀態,人們沒有想到多層會帶來什麼新的變化。


真正引起大家注意的就是2012年史丹佛的實驗(注:2012年穀歌和史丹佛利用多層神經網路和大量資料進行影象識別的實驗),過去實驗的影象樣本數最多是“萬”這個級別,史丹佛用了1000萬,用多層神經網路來做,結果發現在人臉、人體、貓臉三個影象類別中,這個模型的識別率大概有7%-10%的提高。


這給大家非常大的震動,因為通常識別率要提高1%要做好多努力,現在只是把層數增加了,竟然發生兩大變化,一個是識別率提高這麼多;第二個是能處理這麼大資料。這兩個變化給大家非常大的鼓舞,何況在2012年之前,人工智慧沒有解決過實際問題。


經濟觀察報:這種突破的原因是什麼?


張鈸: 現在分析下來是三個原因,大家也都非常清楚了,一個大資料、一個是計算能力、一個是演算法。認識到之後,一夜之間業內業外對深度學習都非常震動,然後就發生了三件歷史性的事件。


第一件事是2015年12月,微軟通過152層的深度網路,將影象識別錯誤率降至3.57%,低於人類的誤識率5.1%;第二件事,2016年微軟做的語音識別,其詞錯率5.9%,和專業速記員水平一樣;第三件事:Alphago打敗韓國圍棋選手李世石。


通過人工智慧,利用深度學習、大資料這兩個工具,在一定條件下、一定領域內竟然能夠超過人類, 這三件事情給大家極大的鼓舞。


特別是對於業外的人,都認為我只要掌握了大資料,利用深度學習說不定還能搞出奇跡來,於是大家做了很多很多預測,比如在多短時間內計算機會在什麼事情上能超過人。


但實際上,在這個之後,奇蹟並沒有發生,按照我的估計,今後也不會大量發生。準確一點說,今後或許會在個別領域取得進展,但是不會像之前預計的那樣全面開花。特別是中國市場樂觀的認為“中國市場大、資料多,運用又不受限制,所以將來奇蹟一定會發生在中國”。


結果很多企業在做的時候發現,不是那麼回事。 從目前的情況來看效果最好的事情還是這兩件:影象識別、語音識別。 我看了一下,中國人工智慧領域20個獨角獸30個準獨角獸企業,近80%都跟影象識別或者語音識別有關係。


經濟觀察報:為什麼會出現這樣的情況?或者說在這麼長時間後,我們對人工智慧目前能做什麼有一個清晰的認識了嗎?


張鈸: 人工智慧在圍棋上戰勝人類後產生了這種恐慌,“大師才能做的事,人工智慧居然能做,我的工作這麼平凡,肯定會被機器所替代”。這裡需要考慮一下它的侷限性,我一直在各種各樣的會上談到不要過於樂觀。


人工智慧能做的那三件事(語音識別、影象識別、圍棋)是因為它滿足了五個條件,就是說只要滿足了這五個條件,計算機就能做好,只要有任何一個或者多個條件不滿足,計算機做起來就困難了。


第一個是必須具備充足的資料, 充足不僅僅是說數量大,還要多樣性,不能殘缺等。


第二個是確定性。


第三個是最重要的,需要完全的資訊, 圍棋就是完全資訊博弈,牌類是不完全資訊博弈,圍棋雖然複雜,但本質上只需要計算速度快,不要靠什麼智慧,可是在日常生活中,我們所有的決策都是在不完全資訊下做的。


第四個是靜態, 包括按確定性的規律演化,就是可預測性問題,在複雜路況下的自動駕駛就不滿足這一條;實際上它既不滿足確定性,也不滿足完全資訊。


第五個就是特定領域, 如果領域太寬他做不了。單任務,即下棋的人工智慧軟體就是下棋,做不了別的。


經濟觀察報:就是說在滿足這五個條件的前提下,目前的人工智慧是勝任部分工作的?


張鈸: 如果你的工作符合這五個條件,絕對會被計算機替代,符合這五個條件的工作特點很明顯,就是四個字“照章辦事”,不需要靈活性,比如出納員、收銀員。如果你的工作富有靈活性和創造性,計算機絕對不可能完全代替,當然部分代替是可能的,因為其中肯定也有一些簡單和重複性的內容。如果認識到這一條就會認識到人工智慧仍處於發展階段的初期。不是像有些人估計的那樣“人工智慧技術已經完全成熟,而進入發展應用的階段”。


640?wx_fmt=jpeg


二、“深度學習技術,從應用角度已經接近天花板了”


經濟觀察報:我們應該怎麼去定義目前的深度學習技術路線,它是基於概率學的一個事物嗎?


張鈸: 現在的深度學習本質是基於概率統計, 什麼叫做概率統計?沒有那麼玄,深度學習是尋找那些重複出現的模式,因此重複多了就被認為是規律(真理),因此謊言重複一千遍就被認為真理,所以為什麼大資料有時會做出非常荒唐的結果,因為不管對不對,只要重複多了它就會按照這個規律走,就是誰說多了就是誰。


我常常講我們現在還沒有進入人工智慧的核心問題,其實人工智慧的核心是知識表示、不確定性推理這些,因為人類智慧的源泉在哪?在知識、經驗、推理能力,這是人類理性的根本。現在形成的人工智慧系統都非常脆弱容易受攻擊或者欺騙,需要大量的資料,而且不可解釋,存在非常嚴重的缺陷,這個缺陷是本質的,由其方法本身引起的。


經濟觀察報:就是說通過改良的方式無法徹底解決?比如我們再增加神經網路層數和複雜性或者再提升資料的量級,會解決它的缺陷嗎?


張鈸: 改良是不行的,深度學習的本質就是利用沒有加工處理過的資料用概率學習的“黑箱”處理方法來尋找它的規律,這個方法本身通常無法找到“有意義”的規律,它只能找到重複出現的模式,也就是說,你光靠資料,是無法達到真正的智慧。


此外,深度學習只是目前人工智慧技術的一部分,人工智慧還有更大更寬的領域需要去研究,知識表示、不確定性處理、人機互動,等等一大片地方,不能說深度學習就是人工智慧,深度學習只是人工智慧的一部分。一直到去年人工智慧大會交流的論文還是三分之一是機器學習方面,三分之二是其他方面。


經濟觀察報:學界在這上面還是有一個比較清晰的認識?


張鈸: 我可以這麼說, 全世界的學界大多數有清晰的認識;全世界的企業界大多持過於樂觀的估計。


為什麼出現這樣的情況呢?因為從事過早期人工智慧研究的人,大多已經故去或者年老,已經沒有話語權。現在活躍在人工智慧研究第一線的都是深度學習、大資料興起以後加入的,他們對人工智慧的瞭解不夠全面。


經濟觀察報:如果說每一個技術路線都有一個“技術潛力”,那麼在深度學習方面,我們已經把這個潛力用了多少?


張鈸: 科學研究是很難精確估計的,但是深度學習如果從應用角度,不去改變它,我覺得已經接近天花板了,就是說你要想再出現奇蹟的可能性比較小了。


經濟觀察報:那基於此,目前商業公司在底層技術和產業應用上還是有很大的空間嗎?


張鈸:只要選好合適的應用場景,利用成熟的人工智慧技術去做應用,還有較大的空間。 目前在學術界圍繞克服深度學習存在的問題,正展開深入的研究工作,希望企業界,特別是中小企業要密切注視研究工作的進展,及時地將新技術應用到自己的產品中。當然像谷歌、BAT這樣規模的企業,他們都會去從事相關的研究工作,他們會把研究、開發與應用結合起來。


經濟觀察報:有一種觀點認為我們強調的“白盒”(可理解性)它實際上是從人的思維來強調的,但是通過大資料、概率統計工具離散到連續的投射,它實際上是機器的思維,你不一定需要它給你一個解釋,只要正確的答案就可以了?


張鈸: 目前有兩種意見,一種觀點認為智慧化的道路是多條的,不是隻有一條路能通向智慧,我們通過自然進化產生了自然智慧,那麼我們為什麼不能通過機器產生機器智慧?這個智慧和自然智慧不會是完全一樣的,條條大路通羅馬,我們通過自然進化獲得的智慧也不見得是最佳的。這個觀點我贊成,機器智慧與人類不相同,其實是有好處的,恰恰可以互補,發揮各自的長處。


但是 從長遠來看,必須得走人類智慧這條路, 為什麼?因為 我們最終是要發展人機協同,人類和機器和諧共處的世界。 我們不是說將來什麼事情都讓機器去管去做,人類在一邊享受。我們要走人機共生這條路,這樣機器的智慧就必須和人類一樣,不然沒法共處,機器做出來的事情,我們不能理解,我們的意圖機器也不知道,二者怎麼能合作?


經濟觀察報:就是必須具有可解釋性?


張鈸:是,就是可解釋性,你要它做決策,你不理解它,飛機就讓它開,誰敢坐這架飛機?所以目前的階段,車和飛機還是不能完全讓機器開的。為什麼司機坐在上面我們放心?因為我們和他同命運,要撞死一塊撞死,機器和你可不是同一命運,它撞不死,你撞死了。


有的人非常脫離實際的去想這個問題,這是不對頭的,人類怎麼會去那樣發展機器呢(注:指把人類的命運全部交給機器)?人類不會去那麼發展的,有些人在那邊擔憂什麼機器人統治人類,我說這最多隻能算遠慮。


經濟觀察報:所以圖靈的論文中也說這種觀點“不值一駁”。


張鈸: 是,那是遠慮,我們目前還有很多近憂,發展人工智慧必須要考慮安全問題,這已是現實問題。


你看語音合成,利用現有的技術可以做到以假亂真,和真人基本沒有差別。現在看來這種技術不能推廣應用,因為一旦推廣就全亂套了,只要搞一段用語音合成技術做成的假錄音,就可以讓任何一位名人身敗名裂。這些都是非常危險的技術。人工智慧的治理已經提到日程上了。


640?wx_fmt=jpeg


三、“我們培養不出愛因斯坦、培養不出圖靈”


經濟觀察報:一種觀點認為中國有更多的資料和更多的工程師,這種規模能倒推帶來基礎研究層面的突破或者決定技術的路線?


張鈸:這裡混淆了好多概念,科學、技術、工程。 科技水平需要三個標準來衡量,一個是科研水平、一個是技術水平、一個是工程實踐能力,或者產業化能力。


我們中國什麼情況?從工程角度來看,在一些領域我們“接近世界水平”;技術水平我用的詞是“較大差距”,因為不少東西還是外國會做我們不會做;科研究領域我用的詞是“很大差距”,科學研究就是原創,實際上,所有人工智慧領域的原創成果都是美國人做出來的,人工智慧領域圖靈獎得主共十一人,十個美國人,一個加拿大人。


經濟觀察報:資料顯示中國在人工智慧領域的論文發表量和被引用次數都已經進入前列位置,這是否說明中國人工智慧科學研究領域的突破?


張鈸: 如果單從論文來看研究水平,基本反映在三個指標上:數量、平均引用率、單篇最高引用率。拿人工智慧來講,中國研究者論文的數量和平均引用率都還不錯,但是單篇最高引用率和世界差距就很大,而這個指標恰恰是反映你的原創能力。


也就是說深度學習這個領域,我們的平均水平達到世界水平了,但是最高水平和世界差距還是很大的。不過還是要肯定的,我們應用上發展比較快。


經濟觀察報:清華在這方面有什麼優勢嗎?


張鈸: 在人工智慧重要的會議雜誌上,這十年期間論文數量、平均質量CMU(美國卡耐基梅隆大學)排第一,清華大學排第二。我們培養的人,在計算機這個領域,清華的本科、博士生都是世界一流的。


目前我們的跟蹤能力是比較強的,一旦有人起個頭,我們能迅速跟上去。但是很可惜,我們缺乏頂尖人物,也培養不出頂尖的人才,如愛因斯坦、圖靈等。


我個人認為原因之一,可能與中國的文化有點關係,我們的從眾心理很嚴重,比如在人工智慧領域,深度學習很熱,發表的論文作者中幾乎70%是華人,但是其他非熱門領域,包括不確定性推理、知識表示等幾乎沒有華人作者。這就是 從眾扎堆,不願意去探索“無人區”。


當然也不要著急,科學研究本來就是富人乾的事情,是富國乾的事情,我們還是發展中國家,科學研究起點比較低,暫時落後是難免的,我們會迎頭趕上。


四、“低潮會發生,但不會像過去那樣”


經濟觀察報:如果說深度學習已進天花板,那麼人工智慧未來的前進方向將會在哪?


張鈸:最近我們準備提出一個新的概念,就是第三代人工智慧的概念,人工智慧實際上經歷過兩代,第一代就是符號推理,第二代就是目前的概率學習(或深度學習),我們認為現在正在進入人工智慧的第三代。原因很明顯,第一代、第二代都有很大的侷限性。


經濟觀察報:你所說的第三代人工智慧技術是有明確的實現方向或者特點嗎?


張鈸:我們現在提出的是要 建立可解釋、魯棒性(注:可以理解為穩健性)的人工智慧理論和方法,發展安全、可靠和可信的人工智慧技術。


經濟觀察報:這樣的技術可能要等很久?


張鈸:是啊,很難預計,我們也很著急。


經濟觀察報:是不是還得迴歸到數學等理論層面裡再去找新的方法?


張鈸:這個目前我們 有兩條路,一個是和數學結合,一個是和腦科學結合。 你想想如果沒有新的數學工具,沒有來自於腦科學啟發下的新思路,哪來的新理論?另一方面是要把資料驅動和知識驅動結合起來,因為通過數學、腦科學上尋求突破是比較艱難的,前面這件事現在則完全能夠做。


經濟觀察報:這個結合是指之前幾十年人工智慧的經驗統合到一塊?


張鈸:是的,至少有一個方向就是要把第一代和第二代結合,利用各自的優勢。但是這兩個結合很困難,因為他們在不同空間中操作,一個是向量空間,一個是符號空間,也需要有新的數學工具的加入。


經濟觀察報:看人工智慧歷史,每一代技術之間有很長的間隔期,第三代人工智慧技術也會這樣嗎?


張鈸:我認為會更長,因為需要攻堅,因為遇到的問題更困難。


經濟觀察報:會不會再過10年、20年,人工智慧在學界或者公眾心中,又變成一個“隱學”,就像70、80年代那樣,大眾又不會再經常提起來這個詞?


張鈸:低潮會發生,但不會像過去那樣,原因在哪?因為有大資料、網際網路和強大的計算資源,這些都會支撐人工智慧繼續走下去,儘管有的時候還只是表面上的繁榮。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2647132/,如需轉載,請註明出處,否則將追究法律責任。

相關文章