作者 | 叢末
編輯 | Camel
這或許是 2019 年年末,國內對人工智慧最後也是最大的一次把脈。
2019 年 12 月 20 日,由鵬城實驗室、新一代人工智慧產業技術創新戰略聯盟主辦的為期兩天的「新一代人工智慧院士高峰論壇」在深圳開幕。
這次會議延續去年強大的院士陣容,今年邀請了多達 10 位院士以及諸多人工智慧領域學術和企業界的頂級專家,從各自的領域深度剖析了人工智慧領域的發展現狀和未來值得探索的方向。
AI 科技評論從第一現場擷取部分學者和專家觀點,以饗讀者!由於內容較多,本文先呈現部分內容,更多資訊敬請 關注 「AI 科技評論」隨後的報導。
1、蒲慕明院士:腦科學與類腦智慧研究
作為大會的第一位報告嘉賓,中國科學院院士、美國科學院外籍院士蒲慕明帶來了主題為《腦科學與類腦智慧研究》的報告。
蒲慕明院士談到:「我認為下一代人工智慧的一個很重要的發展方向就是,腦啟發的新型人工智慧。我們國家在未來 10 年將啟動的重大專案叫做腦科學與類腦研究,整體框架為『一體兩翼』,主體是腦認知功能的神經基礎,做全腦神經連線圖譜,兩翼則是指研究內容分為腦重大疾病診斷和干預、腦機智慧技術研發兩個方向。」
他指出理解大腦需要從三個層面上的神經連線圖譜分析:
第一個是巨集觀圖譜。通過核磁成像的技術可以看到毫米級的神經束,每個神經束都有成千上萬的細胞纖維,傳導方向是雙向,但只瞭解神經束的走向對於理解腦功能並沒有太大貢獻。
第二個是介觀圖譜,空間解析度要達到微米級別。用特殊方法來標記不同的神經元種類,瞭解不同神經元的功能。介觀神經連線圖譜是目前神經科學的主要方向。
第三個是微觀圖譜,空間解析度要達到奈米級別。在微觀層面對神經元軸突和樹突的分佈以及突觸產生規律的研究可以得到很多有用資訊的。
進一步,他認為類腦智慧研究中要考慮三個層次的認知:
第一個層次是對外界的認知,包括感知覺、多感覺整合和注意、分類等,是許多動物都擁有的認知能力,對此可以從動物模型中尋找一些資訊和啟發;
第二個層次是對自我和非我的認知,包括自我意識、共情心和理解他者能力,但可能只有靈長類動物才有,因此只能基於靈長類動物進行研究,而這是我國未來在基礎神經科學研究中最有優勢的領域;
第三個層次是對語言的認知,這是隻有人類才具有的句法、文法以及無限開放式的語言結構,對於研究人類語言的神經機制和演化起源,構建非人靈長類轉基因動物的模型是必要的。
對於這些腦網路特性,人工智慧未來研究中有可以借鑑但目前還沒有借鑑地方呢?蒲慕明院士認為有五個重要的點:
第一,神經元很簡單,有不同性質和種類的神經元,例如抑制性神經元(資訊反轉)、興奮性和抑制性神經元亞型(不同放電特性);
第二,神經網路有順向、逆向側向和的聯接,現在主要是正向的,而加入反向的聯接會帶來好處,而側向聯接尤其重要,並且也是有序的。
第三,神經突觸的可塑性。這個方面除了傳遞效率的增強和削弱(LTP 和 LTD)的功能可塑性,突觸的新生和修剪的結構可塑性也非常有用。
第四,記憶的貯存、提取和消退也非常關鍵,網路中特定突觸群的效率和結構修飾便是記憶的儲存,記憶提出是指電活動的再現於儲存記憶的突觸群,而記憶消退則是指突觸功能與結構修飾隨時間消退。另外根據輸出對學習相關的突觸群修飾,可進行強化學習。
第五,赫伯神經元叢集概念的應用,包括細胞群的建立、多模態資訊的整合,不同資訊的捆綁、同步的資訊震盪、時間相位差以及輸入資訊的圖譜結構等等都可以借鑑
最後,他更是對新型人工網路架構和機器學習演算法提出了四點建議:
一是要擺脫深度學習網路(DNN)的誘惑;
二是要以高效、節能、半監督和無監督學習為目標,建立全新的人工智慧模型和演算法;
三是以脈衝神經網路(SNN)為基礎,加入傳遞延遲,強調時序資訊的重要性;
四是,從簡單的(少數層)的網路為基礎,每次加入一個自然神經網路的特性產生新的架構,然後用新的機器學習和演算法來檢測效果。
除此之外,他認為 AI 界應該提出一個新的機器人或智慧標準,從語言和感知覺能力的整合、團隊合作等更多維度去嘗試建立「新圖靈測試」。
2、高文院士:數字視網膜與雲視覺系統演進
本次論壇的又一位院士——中國工程院院士、鵬城實驗室主任高文接著蒲慕明院士對神經網路的相關介紹,重點分享瞭如何利用對神經網路的理解來改進包括城市大腦或智慧城市系統等現有云視覺系統方面存在的一些問題,他的報告主題是《數字視網膜與雲視覺系統演進》。
首先,他指出了雲視覺系統目前存在的兩大主要的挑戰:
第一,雖然視訊資料非常多,但是能夠對其進行規範並能夠從中挖掘出規律的大資料卻並不多。
第二,這些視訊資料中絕大多數都是正常視訊,而敏感視訊比較少,因而產生的價值並不大。
而深究到底,這兩大問題其實是整個視覺感知系統架構造成的直接後果。對此,高文院士等人從高階生命體視覺系統的進化歷史中尋找靈感,在設計新的第二代城市大腦或者說雲視覺系統時,在中間的視覺神經通道做工作。他們將這一想法稱之為數字視網膜。
他進一步介紹,數字視網膜的定義包括八個基本要素,按照特徵或功能可分為以下三組:
第一組特徵是全域性統一的時空 ID,包括全網統一的時間以及精確的地理位置兩個基本要素;
第二組特徵是多層次視網膜表示,包括視訊編碼、特徵編碼、聯合優化三個基本要素;
第三組是模型可更新、可調節、可定義,即將模型可更新、注意力可調節以及軟體可定義三個基本元素組合到一起。
不同於傳統的攝像頭只有一個流,即一個視訊壓縮流或一個識別結果流,這種數字視網膜存在三個流,即視訊編碼流,特徵編碼流,模型編碼流,三者各自有分工,有的是在前端可以實時控制調節,有的是通過雲端反饋出來進行調節和控制的。
在過去兩三年中,高文院士等人對此也開展了大量工作,重點實現了以下四個使能技術方面的重要進展:
第一個使能技術是高效視訊編碼技術,其中他們提出的場景編碼技術成為中國學者對世界所做出的的一大貢獻,將編碼效率提升到了一個新的水平;
第二個使能技術是是特徵編碼技術,其中就包括他們與國際專家一同完成的兩個國際標準 CDVS 和 CDVA,而 CDVA 更是為滿足支援深度網路而建立的標準。
第三個使能技術是視訊和特徵聯合編碼技術,這是由於視訊編碼和特徵編碼使用的優化模型不一樣,視訊編碼使用的是 2D 優化模型,而特徵編碼聯合使用的是 R-A 模型,兩個模型的曲線方向完全是不一樣的,對此他們提出了聯合優化模型,將 R-A 和 2D 變成一個目標函式,通過求最優解就可實現聯合優化。
第四個使能技術是 CNN 模型編碼技術,能夠實現多模型重用、模型壓縮(差分編碼)和模型更新等優勢。
最後,高文院士總結到,現在的雲視覺系統不是太有效,對此我們可以通過類似於像數字視網膜的新的概念和技術來使其變得更加有效,包括降低位元速率、減少延遲、提高準確率、降低雲端計算成本以及讓低價值的視訊資料轉化為大資料等。
隨著數字視網膜已實現 1.0 版本,下一步該如何走向 2.0 版本呢?答案是:採用脈衝神經網路的思路來做數字視網膜 2.0。
3、湯曉鷗:人工智慧,創新應用
兩位重量級院士的精彩報告後,商湯科技創始人、香港中文大學教授湯曉鷗以一如既往幽默的演講風格為大家帶來了主題為《人工智慧,創新應用》的報告。
「我現在都不知道怎麼做演講了,大家往往只記得我講的笑話,其實我也提到了一些深奧的人生哲理。」
臺下非常「應景」地發出一陣歡笑聲。
呼應主題,湯曉鷗教授首先分享了他對於「創新應用」的理解:
創新,便是做別人沒有做過的事情,帶來的結果是花錢,所以從這個意義上來說,創新的主要目的就是把錢花出去,這似乎是大學的功能;
應用,則是要把創新落地到產品中,然後把產品賣出去,核心是賺錢,這是公司應該做的事情。
然而創新和應用這兩個看似矛盾的點如何並存於公司呢?他指出,對於於世界上絕大多數公司尤其是創業公司而言,根本無法像谷歌等大公司通過已經成熟的業務應用來賺取大量的收入,從而為每年用於創新所投入鉅額的研發費用買單。那該如何找到自己的生存模式 ?
商湯便通過與各行各業進行合作,以 AI+賦能來找到平衡創新和應用的方法論。他進一步以上班族「從早上八點到晚上十點」一天的日常需求,如駕車上班、樓宇辦公、午餐、外出開會、遊戲娛樂、就醫問診、休閒購物等生活場景,介紹了商湯與相關行業在自動駕駛、智慧園區、室內導航、智慧零售等各應用領域的合作與開發成果。
基於自身的實踐經驗,湯曉鷗教授也針對「創新 or 應用」這一兩難的議題給出了自己的經驗和思考:我們最初理解的創新一般都是出論文,做研究,在實驗室裡做別人沒有做過的東西,然而這樣的創新一旦放到市場上往往是不被接受的。
因此,他認為最終的創新其實不僅僅是技術的創新,還應該包括公司中工程的創新、產品的創新甚至是商務模式的創新、銷售模式的創新、合作伙伴合作方式的創新以及整個公司管理模型的創新在內的綜合性創新。
「這樣我們才能夠在殘酷的市場環境中生存下來,才能在無比強大的競爭對手面前找到自己的一塊生存空間。而前面,包括商湯科技在內的很多公司前面,還有很長的路要走。」
4、王海峰:自然語言處理前沿
百度技術長、深度學習技術及應用國家工程實驗室主任王海峰博士帶來主題為《自然語言處理前沿》的報告,分享了他研究近 30 年的心得與觀點。
「自然語言處理是人工智慧非常重要,也是非常熱門的方向。」王海峰博士表示,自然語言處理是用計算機來模擬、延伸及擴充人類語言能力的理論、技術及方法,在國家《新一代人工智慧發展規劃》中也被列為共性關鍵技術。
接著王海峰博士回顧了從基於人工規則到基於深度學習模型的自然語言處理的研究發展歷史:
基於人工規則的自然語言處理需要領域專家、領域知識,並把這些知識建模到計算機系統中去,開發和遷移成本都非常高;
到了基於統計的自然語言處理時期,一定程度上可以實現自動訓練、模型選擇,當時也出現了很多特徵工程師專門去建設各種特徵;另一方面,大量的統計機器學習的模型在不同的應用中會取得不同效果,所以模型本身的選擇具有一定的侷限性。
到了深度學習時代,自然語言處理變得更簡單、更標準化和自動化,一套模型針對不同的資料就可以得到比較好的結果,所以說深度學習跟以前的機器學習模型相比,一個很重要的特點就是有一套可以適用於不同領域、不同應用的方法,這與人腦很像。
他進一步指出,算力、演算法和資料是驅動自然語言處理技術突破的三大要素,而隨著自然語言處理技術的飛速發展,該研究領域也呈現出很多新的變化,如從傳統 NLP 進行層級式結構分析,演變到直接的端到端語義表示;從過去侷限於理解句子,發展到現在多文字、跨模態的內容理解;機器翻譯實現了質量飛躍、從科幻理想落地現實應用等。
隨後,王海峰系統梳理了百度在預訓練語言模型、機器閱讀理解、多模態深度語義理解、機器翻譯等自然語言處理技術發展,及開源開放、推動產業應用的豐碩成果。
5、五大院士把脈:人工智慧的發展現狀以及未來能夠做哪些嘗試
在上午場的Pannel環節, 蒲慕明院士、 高文院士,與美國工程院院士、南方科技大學學術副校長兼教務長 張東曉,中國工程院院士、北京航空航天大學學術委員會主任 趙沁平,中國工程院院士 吳建平一同登臺,就「人工智慧的發展現狀以及未來能夠做哪些嘗試」這一議題表達自己的觀點。
吳建平院士:網際網路與人工智慧之間是相通的
吳建平院士:我雖然研究的是網際網路,不是做人工智慧的技術人員,但網際網路作為人工智慧發展依賴的技術之一,我也談談我的看法。
今年是網際網路的 50 週年,是我們算機科學界是非常重大的紀念節日,而實際上在網際網路的發展歷程中,我們能夠找到人工智慧的明顯痕跡。現在很多通訊手段都要在網際網路高層的協調下才能工作起來,如果沒有網際網路,通訊系統便都是獨立的,那不可能有開發人工智慧的重大機會。因而,除了算力和摩爾定律,我認為網際網路同樣是人工智慧發展的巨大因素之一。
與此同時,人工智慧對於網際網路也意義重大,比如從 3 年前到現在,網際網路仍然使用的兩個著名路由控制:OSPF 和 BGP。二者都在 80 年代末期成為國際標準,其中涵蓋的機理大量採用了人工智慧,其中以 OSPF 為典型,在任何圖譜結構都能實現最優的路由控制,不管採用什麼方式都能達到最優。
這其實就表明了,很多技術之間都是相通以及相互支援的:這一點值得我們深思。
趙沁平院士:為什麼現在的人工智慧都是弱人工智慧?
趙沁平院士:我從 90 年代初期就開始做人工智慧,當時人工智慧還處於基於符號推理、知識處理的階段,當然也有神經網路,但神經網路資料還比較少,還比較弱勢。而現在,神經網路的取得了突破性的進展,並且得到了很深刻的應用。
腦科學是人工智慧的研究方向之一,然而在人工智慧中,人腦其實可以看做一個「黑箱」,而神經網路的研究將這個「黑箱」開啟了一點,能夠看到視覺神經,這是從腦科學角度比較初步地研究人工智慧。
蒲慕明院士在演講中提到繪製人腦的圖譜非常複雜,我對此有兩個建議:
一個建議是不直接繪製成人的腦圖譜,而是繪製從胚胎開始一直到成人的腦圖譜,因為這體現了人腦圖譜的發展過程。與此同時,我們還要繪製到低階動物到高階動物的腦圖譜,不僅是靜態的,也要是動態的,當然這是需要全世界的腦科學家們共同長期努力的結果;
另一個建議是把人腦當成「黑箱」,不斷地吸取腦科學研究的成果,並將這些成果及時地引入到人工智慧演算法等此類研究上。不止是腦科學,還要借鑑行為學研究、認知科學等學科,當然這是從更巨集觀的層面來看。
除此之外,我還有兩個思考:
第一個思考是,為什麼現在的人工智慧都是弱人工智慧?很多做人工智慧的人的回答都是演算法不夠通用、演算法不夠強大。這當然是一個因素,包括人也是一樣,人再能幹也是有行業之分,更何況是計算機和演算法。雖然不存在完全通用的演算法,但是可能存在相對通用的,其中的關鍵在哪?在於知識的學習和積累。
比如一個小孩子從一開始只會吃奶到後來會用筷子,他學習和打通的是什麼?可能是資訊通路和腦的組合,這是值得研究的方向。
而在知識的積累方面,尤其是現在神經網路面臨資料欠缺的問題,這也會成為重要的研究方向,包括如何組織知識,如何將領域知識變成語言知識以及如何通過神經網路和深度學習來將這些知識「為 AI 所用」,這都是值得研究的。
第二個思考是,人工智慧能不能達到像人一樣的智慧水平,能夠將知識逐漸通過自己的學習和演化組織成人腦那樣的一輩子可用的知識?
目前還有很多我們可以研究的方向,我希望領域內的研究者不要一哄而上研究熱門方向,而是要選擇相對冷的方向,我相信整個人工智慧領域應該是波浪式的發展、螺旋式的發展,而這需要我們所有人從各個方面和各個領域來一起為這個目標努力。
張東曉院士:人工智慧的未來是「AI+X」,還是「X+AI」?
張東曉院士:我雖然不是人工智慧的專家,但我對機器學習還比較熟悉。
今天非常高興看到 AI 在各行各業的應用,「AI+X」中的「X」的可以是交通、能源、交融、教育等各行各業,有的應用已經非常成熟了,有的應用現在還剛剛開始。
無論是將人工智慧視作工具還是平臺,我都覺得它應該不能包治百病,不能解決所有的問題,就像剛剛趙院士講到的,當年計算機語言也是一個工具和平臺。
人工智慧將來的應用應該是「AI+X」,還是「X+AI」?我覺得這是值得我們考慮和深思的問題。
比如我現在從事的能源行業,機器學習等人工智慧技術還需要很強的行業背景和行業知識,而如果使用現有的機器學習演算法來做學習和預測,效果可能就不是那麼好了,甚至會出現很多非物理的答案。比如說濃度可以是負的,壓力也是可以超過正常的範圍。而一旦加上行業的知識,比如說物理原理+專家的知識+工程控制條件,演算法得到的學習效果就非常好,比如說在可解釋性、可擴充性,遷移學習等各個方面都會取得非常好的效果。
現在可能我們需要像商湯、百度這樣的公司,但是我覺得更需要一些行業的、專業的公司,這樣才能更好地推動推動 AI 在不同行業中的應用,才能改變整個應用的前景。
蒲慕明院士:絕大多數做腦科學/AI 的科學家都是遊客
蒲慕明院士:我先回答一下趙院士的問題和提出的建議,假設人類大腦結構搞清楚了,不光是成年人的結構,還包括結構怎麼形成,每個人有不同的網路、不同的能力、不同的創造力是怎麼形成?這其實是無盡的科學問題,下個世紀可能都解決不了,但是是大家努力的方向。
趙院士又提到很關鍵的問題,就是智慧,包括自主力、創造力和思維等怎麼樣在人工系統中實現?以及能不能實現?這是一個問題。而從傳統的人工智慧來看,圖靈說「我不知道什麼叫機器,什麼就像人,我只要在平面上跟我對話,分不清楚是人還是機器,它就達到了人類語言的能力」。假設有機器人可以和我們聊天、可以同憂樂並且也能體現創造性的思維,我們就可以說:它從系統上反映了人的層面。至於它是不是有自我意識和更高階的創意在那裡,這其實並不是科學的定義。
下面我主要就腦科學方面談談我的看法。
我國是在全世界的人工智慧應用是領先的,資料和市場都大,但是我們更要看到人工智慧十年、二十年之後的發展。走在人工智慧前沿的大公司看到的並不是今年或明年要賺多少錢,而是十幾二十年後是否還能領頭。這就需要投入一批科研人員做前沿研究,而類腦人工智慧便是啟發於腦科學的其中的一個非常好的方向。這也是為什麼現在像谷歌、微軟等大公司都僱了一大批神經科學的人才去做這方面的研究,會是因為他們意識到這一方向的前景和重要性。
然而就腦科學而言,全中國的科研人員僅為美國的二十分之一(同樣水平的科研人員)、歐洲的三分之一或者四分之一。
並且現在存在的一個非常關鍵的問題是做腦科學和做人工智慧的研究者來自兩個不同的領域,彼此之間很少交流。就目前來看,我國這兩個領域的科研人員彼此之間還很難進行「對話」,所以我希望鵬城實驗室能夠帶頭建立一個機制,讓兩個領域的人開展交叉學習,讓人工智慧領域的人學學腦科學,讓腦科學領域的人學學人工智慧。
無論是做腦科學還是做人工智慧的科研人員,我認為可以分為三類人:
第一類是探險家,這類人非常少,並且其中絕大多數探險家都在歐美國家;
第二類是導遊,他們是領軍式的科學家,以前做過探險家,找到過一方天地,可以帶一批人去看看好風景,這其實是我們非常需要的,但是往往大多數導遊也是國外的;
第三類是遊客,絕大多數科學家屬於這一類,他們被導遊帶著玩山游水,找到一個好玩的地方可能去附近探索一下,但是也不敢走太遠,怕掉隊,就只能一直跟著導遊走。
現在有年輕的科學家跟我說,他們每年都需要發論文、評職稱、申請獎項,哪敢冒探險家的風險?但我認為,做「 50% 的遊客+ 50% 的探險家」是能夠做到的。
高文院士:現在計算機走不了太遠,未來有兩條出路
高文院士:我講兩個觀點。
第一個觀點,蒲院士在報告裡講提到希望建立「新圖靈測試」機制,這其實是個非常好的建議,對於評價人工智慧能不能真的做到位、能否和人類的能力相當很有意義。
因為在圖靈那個年代,環境和技術實現的條件和現在沒法比,所以圖靈測試只對自然語言對話的一種測試,可能實際上圖靈想的東西肯定不是侷限於哪一點,但是落到紙上就是基於自然語言的對話,並以此來判定機器能不能達到人類的能力。但是現在的場景下,圖靈測試應該不僅限於自然語言的互動,還應該包括視覺互動等方面。
現在我們也希望給組內的專家一些課題,希望他們重新設計一個新的圖靈測試,把所有和視訊、影像、自然語言融合在一起,然後再去測試。
而圖靈測試以外時,圖靈當時還有一段非常巧妙的描述,讓一個機器學習,怎麼學習呢?——兒童學習級,分為 1 歲的機器、2 歲的機器,隨著年齡的增長,機器的學習能力也往上增長。
所以圖靈的希望其實更是,機器能夠像人一樣成長。但是現在搞機器學習的研究者,基本上就是把這件事忘了,上來就是識別人臉之類的。
從做人工智慧回到本源,研究像人的成長過程這樣的學習,可能對發現強人工智慧會有幫助。
第二個觀點,我非常同意蒲院士說的腦科學和人工智慧的交叉研究。
他在報告中也提到,他之前在《自然》上發了一篇論文,非常長,但是引用率很低。我當時就在想,可能他沒怎麼參加過人工智慧的會議,如果經常參加的話引用率可能就上去了。
所以兩個領域的研究者聯合起來,去做一些學習和研討,這是非常好的思路。
我之前也在一些場合說過,現在計算機往前走,肯定走不了太遠,會面臨各種各樣的限制,要想變得更強大,只有兩條出路:一條是採用類腦模型做的加速器,來處理人工智慧當前無法解決的問題;另一條是結合量子學,是採用全新的計算方式——算力上去了,一些大的、難的問題就能解決。而這兩條出路,都需要人工智慧與其他學科的交叉研究。