張鈸院士:人工智慧取得了一些進展 但仍有很大侷限性

dicksonjyl560101發表於2018-12-06


http://blog.sina.com.cn/s/blog_cfa68e330102zcvf.html

 

 

中國科學院院士、清華大學人工智慧研究院院長張鈸在第二十屆高交會-中國高新技術論壇演講。

 

其表示現在人工智慧取得了一些進展,但仍然有很大的侷限性。他指出,今後的任務就是要重視基礎研究,發展新的理論來引領技術的突破,物克服目前人工智慧存在的侷限性,擴大應用領域,這樣才有可能真正使得人工智慧讓人類生活得更美好。

 

解決的途徑已經有了,張鈸稱,現在主要的方法是下面三個方面:一個是與腦科學結合尋找新的模型,第二個是把知識驅動與資料驅動結合起來,這是目前最主要在做的事情,而且馬上可以取得比較好的效果,就是把兩種模型結合起來,第三個是常識與常識推理,不確定性處理,這樣才能把人工智慧從單純的工具變成人類真正的夥伴。

 

以下為演講實錄

 

張鈸:大家好,大家現在對人工智慧都非常關注,都想了解下面兩個問題,就是人工智慧究竟現在發展到了什麼程度,我們下一步該怎麼辦?我想用這20分鐘的時間來回答這個問題。

 

大家知道人工智慧的過去,從1956年開始到本世紀初,基本上人工智慧的發展是比較緩慢的。當時人工智慧主要提出了兩個模型,一個模型叫做以知識和經驗為基礎的符號推理模型,用來解決人類理性的智慧。但是這個工作進展得比較小,主要原因是因為這些知識必須來源於人工的輸入,人工把知識輸入機器是很困難的,很多知識是難以準確描述出來的。因此這個模型取得的進展比較少。一直到2011年的時候,這個模型才取得比較大的進展,IBM做的watson系統,在人機競賽上打敗了人類。這也是用這種模型頭一次戰勝了人類。

 

為什麼能取得這個結果呢?主要原因在這,原來對專家系統,我們的知識來自專家,而且專家知識是非常稀缺和昂貴的,而且要把這個知識放到計算機裡面去,用人工的方法輸進去難度非常大,所以當時進展比較小。為什麼2011年能取得這麼大進展呢?最主要的原因就是這裡面把網際網路的大眾知識輸入到系統裡面去,而且這個系統不需要經過人工的加工,直接把知識輸入進去,這個知識相當一部分屬於資料,我們可以把大量的資料輸入到計算機裡面去,才取得這樣的成功。利用這個資料進行推理,然後得到很好的成果。這個知識的數量是很大的,這個知識用紙張來表示的話,差不多是2億頁,這裡麵包括的內容是很多的,包括詞典、百科全書、新聞報導、文學作品等,也就是知識競賽裡面問到的問題都可以包含在這些知識裡面,包括天文地理、娛樂、電影、明星等等。在這種情況下,有了大資料,我們利用這種模型在一定環境和條件下,在人機對話下可以達到一定的水平。

 

第二個模型是現在講的機器學習或者叫做神經網路。當時神經網路所取得的進展,在應用上的進展也很小,最主要的原因是當時神經網路輸入要靠人工來設計,或者來編制特徵。這種情況下我們要做大規模的問題就很困難。這個問題也是到本世紀初有了很大的轉折,這個轉折就是我們現在講的深度學習。也就是把神經元網路的層次增加以後,這個機器學習得到了根本性的改變,從原始的淺層的學習變成現在的深度學習。還有一個重要的改變,我們把原始的資料輸進去,不必人工干預,這樣就使得深度學習變成一個大眾化的,普遍大家都能用的工具,不需要你有專業知識。由於這樣的革命性變化,這個技術就被廣泛採用。這裡紅色的部分表示利用深度學習,我們在許多方面可以達到甚至超過人類的水平,這裡講的主要是三件事,一個是影像識別,一個是語音識別,一個是圍棋。這個成果都是由於深度學習。

 

深度學習最典型的可以用來解決問題,就是模式識別,圍棋為什麼能夠成功呢?我們把下圍棋看成模式識別,通過深度學習,圍棋程式,2015年以前只能達到業餘五段,通過深度學習以後,一下子在兩年的時間實現三級跳,從業餘變成專業,從專業變成世界冠軍,現在遠遠超過世界冠軍。其中最重要的原因就是利用了大量的資料。這個資料可以由它自己產生,也就是說不必人工去提供資料,它自己跟自己下的過程中產生大量的資料。所以後來為什麼Alphago任何人戰勝不了它呢?就是它自己跟自己就下了上億盤棋局。而一個大師一生中也就只能下幾萬盤棋局。

 

從目前來看我們重要的任務就是把深度學習,還有我們在早期提出來的符號推理模型應用到下面十個領域,這是全世界公認的,有可能在交通、家庭、健康、教育等。我們國家特別強調在金融和智慧製造的應用,前面黑色的部分是全世界公認的,在這15年間,特別是深度學習的技術在各個領域可以得到很大的發展。

 

我們可以看到我們國家出現了很多獨角獸企業,這裡列出來了20個獨角獸企業,可以看到基本上是藉助於深度學習技術,而且大部分是集中在影像處理和語音識別這兩個領域。有些方面雖然是屬於醫療,屬於自動駕駛,其實大部分的工作也是做影像識別。

 

我們必須要看到深度學習的侷限性,也就是我們一方面要充分進一步應用深度學習,但是另一方面我們也要看到它的侷限性。這個侷限性儘管它可以在各個領域應用,但是這個領域必須受到下面五個條件的限制。首先要做這個系統,必須要有豐富的知識和資料,如果你既沒有豐富的知識,又沒有資料,你不可能做這樣的工作。必須是完全資訊的,大家知道為什麼在圍棋和國際象棋上,機器能夠戰勝人類?因為象棋和圍棋儘管複雜,但完全是資訊博弈,完全資訊博弈對計算機講是很容易的,不完全資訊博弈,像牌類就不屬於完全資訊博弈,計算機遠不如人類,比如四人麻將、四人橋牌,計算機完全不是人的對手,因為對方拿的什麼牌,出什麼牌你不知道。必須是確定性的,如果存在模糊性,計算機處理起來就比較困難,一般來講是簡單的與靜態的環境,按照確定的規律變化的。另外是限定領域和單任務,也就是它能下圍棋只能下圍棋,不會下象棋,而且這個任務是單個的,不能開放的,一開放就做不到了。

 

現在用大資料建立的識別系統,儘管在某個指標上超過人類,但在其他方面跟人類相比差距非常大。我們這裡也列出來了很多,包括魯棒性、推廣性等。計算機的影像識別率即使能達到跟人差不多,但就是這樣的物體,我們扔一個照片給它可以識別為知更鳥。我們隨便給它一個照片,它可以識別為獵豹。這就說明它本質上並不認識這個動物,它只能把不同的動物分開,這跟人類非常不一樣,因此它很容易被欺騙。我們扔一個噪聲給它就可以讓它識別成任何東西,這是它很大的弱點。這個弱點在很多應用場合裡面是不允許的,如果在人臉識別、影像識別裡面如果有這樣的錯誤還可以容忍的話,如果這樣的錯誤出現在決策上是不允許的,而且是人不可理解的。還有魯棒性很差,本來這張圖片是阿爾卑斯山,我們只要給它加一點點噪聲,這個圖片跟原來的圖片差不多多少,只是多了一些噪聲,人看起來當然還是阿爾卑斯山,但是可以讓計算機看成是一條狗,而且它的自信度可以達到99.99%。也就是說它有99.99%的把握認定這張圖是狗。那就說明這樣的系統非常容易被攻擊,這就是目前大家討論到的人工智慧的安全性問題,人工智慧系統非常容易受攻擊,非常容易被欺騙。這在很多應用場合裡面是不允許這樣的。所以我們必須要克服這個問題。

 

比如醫學影像識別,計算機識別率能夠超過人類,但是醫生不敢用,因為你判斷這張圖片是有癌症,醫生根本不知道你根據什麼判斷出來的,是不可解釋的,所以醫生信不過,這是普遍遇到的問題。魯棒性也是這樣,語音識別,大家看過很多演示,語音識別在一定條件下超過人,但是抗干擾能力非常弱,如果我們對著話筒講識別率可以很高,如果我離開話筒很遠識別率就低得多,如果有其他人在旁邊說話,根本就聽不懂誰在說。所以抗干擾能力非常弱。所以只能在非常乾淨的條件下才能使用,在嘈雜的環境下是不能用的。處理突發事件的能力,這也是目前自動駕駛遇到的問題,自動駕駛目前在特殊情況下,專用道或者是簡單的路況也許能夠用,但是複雜的路況還是不好用的,為什麼?就是它缺少處理突發事件的能力,也就是這種情況它沒有學習過就不知道怎麼處理。比如在交通裡面會遇到這樣的情況,行人是這麼過馬路的,那麼計算機肯定看不明白這個應該怎麼處理。你也可以把這種情況學習了以後,我們遇到這樣的情況就不行。還有一個問題,計算機沒有常識,也很難達到智慧。如果你告訴計算機川普是美國總統,那你問誰是美國總統,它可以答得非常好。但如果你問美國有沒有總統,它答不上來。川普是美國人嗎?它也答不上來。它既然知道川普是美國總統,美國當然有總統,這是常識推理,如果不能做到這個就很難真正達到智慧。

 

所以我們目前面臨的挑戰,如果人工智慧取得了一些進展,但仍然有很大的侷限性。我們今後的任務,深圳非常重視基礎研究,發展新的理論來引領技術的突破,物克服目前人工智慧存在的侷限性,擴大應用領域,這樣才有可能真正使得人工智慧讓人類生活得更美好。目前我們解決的途徑也都有了,要解決魯棒與可解釋的人工智慧。現在主要的方法是下面三個方面,一個是與腦科學結合尋找新的模型,第二個是把知識驅動與資料驅動結合起來,這是目前最主要在做的事情,而且馬上可以取得比較好的效果,就是把兩種模型結合起來,第三個是常識與常識推理,不確定性處理,這樣才能把人工智慧從單純的工具變成人類真正的夥伴。

 

 

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2284425/,如需轉載,請註明出處,否則將追究法律責任。

相關文章