徐宗本院士:數學與 AI 的關係是「融通共進」| CCAI 2019
9 月 21 日至 22 日,為期兩天的 CCAI 2019 正在秋意濃濃的中國青島膠州隆重舉行。本次會議選址室外體育館召開,為原本嚴肅的學術會議增添了幾分活潑、愜意的色彩。
CCAI 2019 會場外景
會議第二日,徐宗本院士作為首位演講嘉賓,從他的數學專業出發,慷慨激昂地為大家帶來了主題為《AI 與數學:融通共進》的報告。
在開場前,他先從徐匡迪之問——「人工智慧的基石在數學,我們有多少數學家投身進去了?」以及任正非答記者問時強調「人工智慧的本質就是數學」的觀點引入,表達了自己對於人工智慧與數學之間的關係的看法:融通共進,一方面,人工智慧的基礎之一是數學,因此人工智慧想要行穩致遠,就必須先把數學的基本問題解決好;另一方面,人工智慧的發展也對數學領域的研究產生了重要的推動作用。
在本次報告中,徐宗本院士重點分享的內容包括四個部分:第一,為理解人工智慧和數學之間的關係提供一個框架,闡述數學方法與人工智慧方法在處理問題的方法論上存在著本質上的一致性,因而二者能夠「融通」;第二,從數學維度指出人工智慧在目前發展中所存在的幾個關鍵問題;第三,展示人工智慧為數學研究所帶來的新的方法論;第四,為人工智慧與數學的融合方式提出具體方法。
與此同時,徐宗本院士也指出,本次他演講中提到的「人工智慧」,主要是指機器學習,雖然這只是人工智慧的一部分,但是就他看來,是最能夠直接成為生產力並且也是非常重要的部分。
AI 與數學:在解決問題的基本方法論上具有一致性
一開始,徐宗本院士對機器學習的基本概念進行了解釋,他表示,簡單而言,智慧就是模擬人的一種行為或者說能力,即在給定環境中,能通過與環境的互動和自行來提高自身解決問題的能力,而採用一個機器或者軟體來模擬這種智慧時,就是機器學習。 從數學的維度而言,機器學習表示的是一個函式空間或引數空間的優化問題。
他認為,無論是從機器學習還是數學,二者在解決問題上都可以用上圖中的這一框架來描述,其中包括兩個最為重要的部分:一個是智慧體,一個是環境。
-
智慧體:它是指一個含引數、可調節的任務求解器,其形態可以是深度網路,也可以是機器人、無人系統或者一個演算法。
-
環境:這裡所說的環境一定有兩個基本性質:第一,環境是可以描述的,如果用資料來描述就是人工智慧方法,如果用模型來描述就是數學方法或物理方法,如果是用知識來描述的就可能是知識工程方法等等;第二,環境是可以對其進行建模的,能夠藉以對智慧體的行為作出判斷,即可作為修正智慧體行為的指標。
「具備這兩個基本性質的環境加上智慧體,組成的統一體便叫做機器學習系統,這其實就是我們研究問題的基本方法論。」
接下來,徐宗本院士也介紹了機器學者的幾個典型模型,包括:
第一,深度學習。所謂的深度學習就是指輸入一個資料,然後得到一個依賴於資料的預測或者是判斷,它的環境是有標籤的大資料,同時其應用的基本前提是有原因或結果組成且量很大的有序對。
第二,自編碼器。當下這一代的人工智慧就在於特徵表述,這就涉及到自編碼器這項重要的技術。編碼器的任務就是提取資料的內涵特徵,可以用來實現降維等任務。它的環境是無標籤的資料。
第三,對抗生成(GAN)。大資料不夠是大資料領域的常見問題,而對抗生成便是使用網路生成一些資料的模型。它的環境是沒有標籤同時量也很小的小資料,不過這些資料都是比較準確的,也就是我們所說的原資料。
第四,強化學習。強化學習時該研究領域常用的模型,它要解決的是需要對最終的決策負責的場景,比如智慧駕駛需要在當下時刻知道下一步怎麼走,比如說在下棋的時候也要知道走了這一步後,將對將來的勝負產生多大的影響等等。它的環境不一定是資料,比如說自動駕駛的環境就是各種感測器對身處環境的描述。
「那在這些模型中,數學和物理充當什麼作用呢?以上圖強化學習為例,智慧體就正在解決一個數學問題,此刻它的環境就是給定的數學公式、定解條件或邊界條件等。 因此從本質上來看,人工智慧、知識工程以及數學在解決問題時所使用的基本方法論其實是具有統一性的。」
目前,人工智慧已經經過了「從一個不可用的技術發展到一個可應用的技術」的拐點,其原因有三:一是有了大量有標籤的大資料;二是出現了像深度學習這樣的標準模型和演算法;三是擁有了強大的計算力,例如超算和雲端計算。
對此,徐宗本院士指出, 在欣喜人工智慧變成可用技術的同時,我們必須冷靜地看到,目前我們距離人工智慧的真正產業化,真正能把人工智慧技術用得明白、也用得好,仍然還有很長一段路要走。以機器學習為例,從資料層面上講,我們還需要使用大量的人工去標註,去選擇樣本;從應用層面而言,還需要自己去搭建不同的神經結構,去選擇不同的訓練演算法,因而在現階段,我們還處於一個「用多少人工換來多少智慧」的人工智慧階段。
而要想從「可以用」走到「很好用」則還存在很多技術挑戰:首先在資料樣本層面上,資料樣本需要實現自生成、自選擇;其次在模型演算法層面上,模型演算法需要實現自構建、自設計;最後在環境任務層面上,環境任務要實現自適應、自轉換。
「我們將實現了 以上三個方面的六個特徵的人工智慧叫做機器學習自動化,這是我帶領的研究小組這幾年在主攻的方向。 關於大家問到人工智慧未來的發展方向,我們不妨以實現共產主義來做類比:我認為人工智慧的共產主義目標是自主智慧,然而在實現共產主義之前我們必須先走過社會主義初級階段——機器學習自動化便是社會主義初級階段目標。所以說,人工智慧的發展軌跡應該是從人工走向自動化,再邁向自主智慧。」
AI 發展面臨的五大數學基礎問題
基於以上提及的下一步人工智慧發展目標,徐宗本院士指出,要想真正實現機器的自動化,必須首先解決以下五個數學領域的基礎問題:
第一,大資料的統計學基礎。人工智慧應用的基本模式則包括感、知、控三個部分,其中,感,就是將環境中的各種要素通過各種各樣的感測器變成資料的數字化過程;知,就是指能讀懂大資料,這是機器學習的主要部分;控,則是指機器將由資料得到的知識和規則用於實際控制。貫穿著三個基本模型的核心技術便是大資料,而統計學則是理解、分析大資料的基礎。目前,支援大資料分析的數學基礎尚未完全建立起來。
第二,大資料計算基礎演算法。大資料一般應用於分析處理兩類基本任務:一類是以計算機邏輯為基礎的搜尋、比對、排序、溯源等問題;一類是分析資料之間是否具有共性結構等的聚類、分類、迴歸等問題。這兩類問題都以數學模型為基礎。然而一些傳統的計算,在大資料環境下都變成了全新的問題,因而針對大資料環境重建大資料計算的基礎演算法和分析處理演算法,都成為當下亟待解決的問題。
第三,深度學習的數學原理。「深度學習現在存在很多毛病,張鈸院士昨天也說過了,然而深度學習是目前最能夠為大家所普遍接受的人工智慧技術之一,就像高考,雖然被人詬病很多,但是目前還沒有更好的方式來替代它一樣,深度學習同樣如此。比如它存在的可解釋性問題,主要還是因為它無法使用明確的資料公式來進行展開,因而如何從數學上證明深度學習在每一層網路上的展開情況,是當下迫在眉睫的事情;另外,什麼樣的結構決定什麼樣的性質,因而我們還需要研究清楚深度學習中結構和性質的關係問題。
第四,非常規約束下的輸運問題。人工智慧的很多問題都可以抽象為:將一個領域的資料轉移到另外一個領域的資料,比如說機器翻譯,就實現不同語言之間的轉換問題。這自然就涉及到「什麼樣的資料之間能夠進行轉移」的問題。而眾所周知,能夠實現轉移的前提是,兩個領域之間的資料存在一「公共不變數」,這是數學的標準術語。比如說機器能翻譯就存在語義這一不變數,例如醫療應用同樣遵循這一思路,即 CT 圖象轉成核磁圖象過程中,同一個人本身就是就是這個不變數。如何判斷資料能夠被轉移,以及如何實現不同領域的資料轉移問題,就叫做非傳統約束下的傳輸問題。
第五,學習方法論的建模與函式空間上的學習理論。目前機器學習所處的階段是:資料是中心以及機器學習和泛化的物件。這就要求資料對問題具有普適性、可推廣性以及學習性,數學中對此的一個提法是學習方法論或者說函式空間上的學習理論。在邁向機器學習自動化之前,就必須使其具有對相關問題的公共方法論的學習,然而目前這還是一個全新的研究領域,暫時還沒有出現相關的研究框架。
「這五個問題是通向自主智慧鎖必須解決的基本問題,而這也反過來說明了為什麼我們都說人工智慧的基石在數學的原因。」
AI 反過來為數學研究提供了全新的視角
數學對於人工智慧的基礎性作用不言而喻,而反過來,人工智慧技術同樣也為數學領域的研究帶來了全新的視角,並帶來了一些革命性影響。徐宗本院士主要基於人工智慧為優化、PDE 問題的數學研究所帶來的推動作用,進行了該部分的介紹。
AI 對優化的應用
最優化是數學的基本問題,然而數學傳統在研究這個問題上有很多的侷限性,包括無法實現全域性優化、不涉及超引數問題以及適配性問題等,例如在區域性優化方面研究得很徹底,但就是沒有人研究解決某個「世紀」問題應該用什麼方法。而人工智慧在這幾個問題上的應用,都能帶來非常可喜的結果。
徐宗本院士表示,人工智慧對優化問題的研究帶來了全新的思考,對此他提到了三個案例:
第一,解決適配性問題。「Learn to Learn」這個方法最早出現於 2006 年,隨後就一發不可收拾地出現了很多技術,包括「學會搜尋」、「學會 teach」、「學會推理」等以「學會」為主體的推理方法。這類方法都是從巨集觀學習方法論的角度解決問題,基於這些方法,現在我們已經有了一個對任意優化問題都可用的自適應優化器。
第二,解決超引數問題。以壓縮感知問題為例,下圖為壓縮感知的基本框架。公式中,第一項是擬合項,現在採用人工智慧技術以後,可以在公式中將超引數作為引數使用,對照著問題去訓練,能夠一次性地把壓縮感知的選擇問題解決,該方法尤其是在圖象處理、醫療成像等應用中,都是實現了目前效能最好的神經網路模型。
第三,解全域性優化問題。全域性優化問題一直以來都是個難題,但如果從強化學習的視角來解決這個問題,它的面貌就會煥然一新。比如在 MNIST 手寫數字識別中要解決 7960 維的優化問題,就可以使用全梯度下降方法來進行優化。
AI 對 PDE 問題的應用
而人工智慧對 PDE 問題的應用,同樣被徐宗本院士視作人工智慧在數學中的成功應用。下圖中公式為 PDE 的一般形式:第一行方程式是含導數的關係式;第二行方方程式則是指該函式應該滿足的初始條件;第三行方程式方式則表示公式在邊界情況下的對應關係。三個方程式合在一起就是微分方程定解問題。
對此,數學家已經提出了有限差分法、有限元法、有限體方法等等,都很成功,然而不得不承認的是,在解決複雜邊界以及複雜的函式時,這些方法的效果並不好。而人工智慧則為這一問題提供了一個全新的視角和完全不同的解決方向,即利用對空間的取樣即積分方法來提到離散化的微分方法。
對應人工智慧的框架來說,即可以將智慧體理解為找微分方程解,環境就可以理解為上面方程式給出的初始條件和邊界對應關係。基於這種方法,最終能夠讓神經網路逼近微分方程的解。
同時,徐宗本院士還特別介紹了 AI 在反問題中的應用。他指出,反問題是 CT、核磁共振、雷達等應用的基礎之基礎,都是根據已知的東西推理未知的東西,而如果將這些問題改造成神經網路的話,就能帶來意想不到的效果。
首先是受到編碼器的啟示,他對自編碼器提供的「黑箱」編碼、解碼以及資料編碼、解碼的方法進行改造,提出了模型驅動、機理溶入的反問題求解框架,並由此提出解反問題的無監督學習、全監督學習和半監督學習的三種模式都採用這一框架去實現的觀點。
其次在解線性方程組的應用上,此前,Y=aX 作為線性方程組的基本公式,我們一定需要知道 a 的具體值以及是否可逆的等等。而現在深度學習則能夠做到「不問東西」、「不問青紅皁白」地直接給出解。
另外在地震波反演的應用上,在使用人工智慧方法後,地震勘探不再只是單純解偏方程數字解,最終更能夠「看清楚」地底下的情況。
AI 與數學融合共通方法論:資料不夠模型補,模型不精資料上
演講最後,徐宗本院士還對 AI 與數學未來的「融合共通」發展進行了展望,提出了具體的研究方向。他指出,從認識論和方法論上來看,數學與 AI 互動作用的本質是提倡「模型驅動」與「資料驅動」的結合,而這種結合具有巨大的潛力,其中具體的結合方式包括:
第一,資料不夠模型補,模型不精資料上。「這句話,這兩年我說過很多次,現在我越來越覺得這兩句話很對。一方面,當我們抱怨資料不夠時,我們還可以想想我們在幾十年的研究中已經積攢了很多模型,並且模型就是資料的昇華,因而用上一個好的模型可以大大減少對資料的依賴性;另一方面,模型好自然很好,然而當無法實現一個精緻的模型時,我們還能夠用資料去補,實際上現在在很多科學研究中,研究者們都在用資料彌補模型上的不足。」
第二,物理機理啟發,知識融入。「這同樣也是極為重要的科學方法論,是我們可以用來提高解決問題的質量以及人工智慧效能的重要法寶。」
https://www.leiphone.com/news/201909/uOmvQDxfp64OhOKU.html
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2657915/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 徐童:視訊人物社交關係圖生成與應用
- 統計學三大相關係數之Pearson相關係數、Spearman相關係數
- R語言作業:樣本容量與好樣本概率的關係R語言
- 從因果關係來看小樣本學習
- 丘成桐演講全文:幾何與計算數學的關係
- 2019年末,10 位院士對 AI 的深度把脈(上)AI
- 2019年末,10 位院士對 AI 的深度把脈(下)AI
- CRM管理系統是如何進行客戶關係管理的?
- 特殊特性與FMEA之間的關係是什麼?
- Spring Boot與Spring Cloud是什麼關係?Spring BootCloud
- Spring boot與Spring cloud 是什麼關係?Spring BootCloud
- Object與Class的關係Object
- GNU與Linux 的關係Linux
- Scala與Java的關係Java
- 斐波那契數列魔法塔數字量與層數的關係
- 奈學:Java 和 JavaScript 是什麼關係?JavaScript
- 通俗解釋協方差與相關係數
- AAAI 2019 | 基於分層強化學習的關係抽取AI強化學習
- IP、域名和DNS的關係與區別是什麼?DNS
- AI治理時代的航母!徐立:商湯的答案是「發展」AI
- 與數學相關的類
- CCAI 2020 | 探秘AI的未來:對話Yolanda GilAI
- 數字化與智慧經營的關係非同尋常?
- SQL與NoSQL(關係型與非關係型)資料庫的區別SQL資料庫
- JSON 與 JS 物件的關係JSON物件
- 圖片與向量的關係
- 機率論11 協方差與相關係數
- Excutors 與 ThreadPoolExcutor 的關係與區別thread
- Docker與containerd的關係與區別DockerAI
- 徐剛:AIGC時代,人力資源數智化的關鍵趨勢與應對AIGC
- AI智慧與大資料的本質區別是什麼?AI大資料
- 《花雕學AI》17:關注提示工程—本世紀最重要的技能可能就是與AI人工智慧對話AI人工智慧
- 【深度學習基礎-14】迴歸中的相關係數r和決定係數R^2深度學習
- Hadoop與Spark關係HadoopSpark
- Cookie與Session 關係CookieSession
- 數倉血緣關係資料的儲存與讀寫
- 大資料與Hadoop之間是什麼關係?大資料Hadoop
- AI成功是因為數學嗎?AI