本講座出自2016年9月20日由北京郵電大學智慧科學中心教授、中國人工智慧學會第4和第5屆理事會理事長鍾義信在清華大資料產業聯合會“應用•創新”系列講座上所做的題為《人工智慧與大資料的創新研究》的精彩演講。

1475922166-2983-94de80684e441962d3b311
 

演講提綱

–人工智慧:概念,現狀,趨勢

–人工智慧應用

演講全文

鍾義信:各位晚上好,非常高興又有機會到FIT大樓的二層多功能廳跟大家做“人工智慧和大資料”創新研究的交流。清華大學資料研究院在這方面做了大量的工作,成績卓著。今天這個交流我準備重點談談自己對人工智慧、大資料的一些理解。

1475922166-6133-94de80684e441962d3dd12
 
人機大戰AlphaGo以4:1取得勝利引起了很多議論,不同的人對此有不同的思考。其中從事人工智慧研究的科技人員的動向不能忽視,人工智已經進入了一個新的階段,國家現在提倡“創新”,光有技術上的研究熱情是不夠的。

1475922166-7714-94de80684e441962d45413
 
什麼是人工智慧的門道?

1475922166-8963-94de80684e441962d46514
 
從某種意義上來說,人工智慧系統就是人類主體所寄予的希望。智慧表現在:

一、能夠達到主體的目的——解決問題,這是一個標誌;

二、這個行為不要破壞環境的客觀規律。

什麼叫人工智慧?“人工智慧系統就是實現資訊轉換與智慧創生的機器系統”。這是人工智慧系統的功能模型,是一個宏觀的模型,是一個本質的模型。

1475922166-5615-94de80684e441962d48a15
 
智慧有兩部分,兩部分既互相聯絡、又互相補充,有機的聯絡在一起,成為人類智慧的整體。智慧和智慧是不一樣的,“慧”是認識事物的能力,“能”是解決問題的能力。我們把顯性智慧叫做智慧,這種人工智慧的概念跟資訊轉化與智慧創生是相通的。隱性智慧只給三樣東西,問題、目標、知識。所以顯而易見,人工智慧離不開人。

1475922166-8116-94de80684e441962d49b16
 
機器可以獲得顯性智慧並模擬人類的智慧,但是很難具備隱性智慧,這就是它“不能”的原因。另一方面,人工智慧機器可以比人類更厲害的去完成工作,這是它“能”的原因。人工智慧系統的應用前景一定是面向問題或者面向某些問題的領域,不要妄想追求一個通用問題的求解。

1475922167-9752-94de80684e441962d4cb17
 
三個學派都有其一定的道理,也有其輝煌的成果。然而現狀是這三條研究思路未能形成合力。大家都研究人工智慧,為什麼這三個思路走不到一起?《系統論》告訴我們,系統的功能遠遠要強於部分功能的和,這個趨勢說明了——應該走向統一。

1475922167-8445-94de80684e441962d4f218
 
“生態演化論”最要緊的不是具體的結構,也不是具體的功能,更不是具體的行為,而是這個系統的運轉機制。它為什麼會有智慧?產生智慧策略的機制是什麼?具體的機制怎麼表現?機制在於資訊、知識、智慧三者之間的轉換,這是機制的靈魂。

1475922167-6359-94de80684e441962d4ff19
 
主體產生的感知資訊來自於客體資訊,然而感知資訊並不是客體資訊,因為這個過程中有主體因素、感知因素的加入。感知資訊比客體資訊更復雜,內涵更豐富。感測器產生的資訊就不是這裡講的感知資訊,它沒有感知的內涵。語法、語意、語用三個為一體是感知資訊,其它的是語法資訊。透過資訊認知它們的本質,這是“知識”。透過認識的活動、處理得到知識,這叫“認知”,會儲存在知識庫裡面。還要想辦法利用資訊和知識以及目的生成智慧策略,智慧策略經過執行機構才會產生智慧行為。人工智慧就是按照這樣的模型去實現的一個機器系統,這是中國人對人工智慧的發展,與結構模擬、功能模擬、行為模擬大不一樣。

1475922167-9538-94de80684e441962d50c1a
 
感知資訊比現在所理解的資訊複雜,有語法資訊、語義資訊、語用資訊。語法資訊是形態的描述。語用資訊是對我們的利害關係、目標的描述。語義資訊是內容、意思。透過這個模型可以看出語義資訊它有嚴格的定義(對映+命名),有很具體的生成方法和原理,原理裡面的每一項都能夠用今天的技術實現出來。大家關心的是它的內容,絕不是隻關心它的形式,這個內容就是語義資訊。

1475922167-2545-94de80684e441962d51a1b
 
人工神經網路:一切人工神經網路要得到網路的加權,要得到它的知識一定要透過大量的樣本去學習、訓練得到連線權。

物理符號系統:它是規範性知識,現流行稱專家系統,目標是無窮大通用物理符號系統。所以實際有用的是專家系統,專家系統要有專家知識。

感知動作系統:有智慧的機器人會回應你,這是刺激——響應,把常識性知識透過編碼輸入到知識庫裡面。

在機制主義人工智慧框架裡,A、B、C型不只是特例,A型可以轉化為B型,A、B型可以轉化為C型。因為經驗性知識可以提煉成規範性知識,這兩種知識可以普及沉澱成常識性知識。它們是相通的,三大學派互不認可的局面就不復存在。這是研究高等人工智慧–研究情感、意識、理智,機制主義可以解決這個問題。

1475922167-6007-94de80684e441962d52e1c
1475922168-8741-94de80684e441962d5381d
 
這個模型告訴我們,機制主義是一個恆定的規律。

1475922168-9480-94de80684e441962d5461e
 
按照這個定律,原始的東西轉換以後才能得到知識、策略。轉換結果不再關注守恆不變的那些東西,而成為關注解決問題的智慧。三者並駕齊驅,三位一體,形成物質、能量、資訊三大領域的三個定律。

1475922168-2430-94de80684e441962d5541f
 
1475922168-5153-94de80684e441962d56220
 
前面講資訊爆炸,今天講資料爆炸,這兩個東西有沒有關係?為什麼有這兩個爆炸?這其實是沒把概念搞清楚。我認為我們要要冷靜下來,把這些概念搞清楚,抓住它的本質和要害進行深入研究。

1475922168-3136-94de80684e441962d57421
 
大資料的技術實際上是人工智慧技術。有四個“V”,第一個Value,有價值;第二個Volume,有價值且容量大;第三個Velocity,每秒的速度很快;第四個Variety,種類繁多。所以什麼叫做大資料?現在我們所擁有的資訊科技處理不了的資料。對資料丟棄、忽略、過濾,這是第一步要做的。

1475922168-6843-94de80684e441962d59123
 
物聯網要有感測器,要感知外界事物的狀態、資訊,這是“知”。我們需要知道這個物的狀態,但更重要的是知道後要調解它,所以要生成策略。由策略控制這個物,這才是真正的物聯網,又監又控。

1475922169-8906-94de80684e441962d5a224
 
這個工具被高度智慧化的勞動者所掌握、駕馭、使用,用來解決各種各樣的問題,去應付各種各樣的物件,三位一體,形成智慧化的社會生產力。從這個模型來看,科學技術主要體現在成果。隨著它的進步人也要進步,智慧化的人駕馭智慧化的工具,以智慧化的水平解決各種問題,這就是智慧化的社會生產力的狀況,它的應用範圍是無處不在的。

這樣一來,大資料就比較容易去理解和研究了。以上很多都是個人觀點,這裡面有創新的部分,但是也可能跟大家的理解有碰撞和冒犯的地方,如果不對請大家多多批評。謝謝大家!

1475922169-2736-94de80684e441962d5b325
 
互動環節

提問1:我們現在一般認為人工智慧是學計算機方向做的事情,您的演講給人感覺也要有資訊理論方面的背景,您的研究中有用到這樣的研究方式嗎?您是怎麼把資訊理論和人工智慧結合起來做研究的?以及您認為現在人工智慧的興起對於我們做資訊理論的來說是機遇還是挑戰?如果是機遇應該怎麼把握?是挑戰應該怎樣應對?

鍾義信:智慧是整個資訊過程的高階,資訊是原材料,最終最有用的是智慧。智慧跟資訊是一體化的,有資訊理論的基礎去研究人工智慧會很好。我們利用先頭的資訊理論為基礎擴充套件變成全資訊理論,然後去研究人工智慧,這樣可能做出新的貢獻,也能對人工智慧提出新的思考,得到一些新的結果。這個既是挑戰,也是一個創新的機會。

提問2:我現在在公司裡面做資料探勘。我比較感興趣數決挖掘方面的一些動態。

鍾義信:如果從資訊轉換角度看資料探勘,它本身就是一個轉換,所以我覺得這個領域是非常重要的,人工智慧當中沒有它不行。挖掘就希望挖掘出知識來,這個知識是產生智慧的一個非常重要的前提。我覺得如果能找出這個轉換的基本規律,就可以迴避掉資料探勘中的一個嚴重問題。現在資料探勘發展很快,成果也很多,但是它的問題在於沒有提高到一個普遍的挖掘方法和挖掘原理的高度上,或者說轉換原理和轉換方法的高度上。因為資料探勘都是針對具體資料庫來做的,技術性比較強,而理論性的共性方面還不夠,所以這裡面有很大創新的潛力。

我剛才講到大資料跟人工智慧、資訊科學互相之間的關係,其實背後最重要的一句話就是——我們大家是一家人。這是我要講的心裡話。

來源:資料派