整理 | 夕顏
出品 | AI科技大本營( ID:rgznai100)
在人工智慧領域中,深度學習掀起了最近一次浪潮,但在實踐和應用中也面臨著諸多挑戰,特別是關係到人的生命,如醫療、自動駕駛等領域場景時,黑盒的不可解釋性、安全等一系列問題仍然是產學研界 關注的焦點問題。
2019 年 9 月,由新一代人工智慧產業技術創新戰略聯盟(AITISA)指導,鵬城實驗室、北京智源人工智慧研究院支援,專業中文 IT 技術社群 CSDN 主辦的 2019 中國 AI 開發者大會(AI ProCon 2019)在北京順利舉行。短短 3 天之內,60+ 人工智慧領域專家和領導者相聚北京,加入了這場屬於 AI 開發者的盛大狂歡,探討機器學習、自然語言處理、計算機視覺、AI+DevOps 和 AI+ 小程式等多個不同技術專題裡開發者最關心的問題。
在機器學習技術專場,Real AI(瑞萊智慧)的 CEO 田天發表了題為《第三代AI思考與實踐》的演講,分享了自己對深度學習的反思。這家成立僅一年左右的公司孵化於清華大學人工智慧研究院,專注於第三代人工智慧技術研究以及應用落地。
報告伊始,田天首先介紹了 RealAI 公司,表示該公司名稱表達了一個理念:希望做一些與現在市場上主流的深度神經網路不同的 AI 技術。隨後,田天用實際案例指出,當今以深度學習為代表的 AI 演算法仍然存在很多侷限性,面對這些侷限性,RealAI 採用貝葉斯深度學習方法,帶來更加可信、可靠、安全的 AI 演算法。他還講到 AI發展的現狀,以及 AI 經歷第一代、第二代和第三代以來發生的變化。最後,他還總結了第三代 AI 將帶來大量全新的應用場景與商業價值。
關於第三代人工智慧,RealAI 還有哪些思考和實踐,讓我們從田天的演講中梳理一下。
人工智慧發展現狀
現在,大家講的AI主要是指深度學習等技術,我們要講第三代人工智慧,需要首先回顧一下什麼是第一代和第二代人工智慧技術。
人工智慧發展歷程有很多不同的劃分方法,從我們的角度,可以劃分為兩個階段, 第一代是知識驅動的符號模型,最典型的是邏輯專家系統,它能夠基於規則狹義定義任務系統。現在看來,符號模型的可解釋性非常強,但同時也存在一些問題,比如基於規則和知識驅動的系統很難做到大規模,系統做大需要總結大量的規則給到系統,但因為人工精力有限,不可能窮盡所有的知識,因此這種方式無法解決大規模、大資料時代的問題。這是第一代知識驅動型的符號系統。
最近一段時間大家都做 資料驅動型 AI,包括早期的淺層統計學習方法、現在最熱門的深度學習方法,都屬於第二代人工智慧。它的特點是從資料內部,不是由人提取知識編寫程式,而是由程式或神經網路自動從資料中提取經驗和規則,來完成未來的決策任務。它的好處是可以面對大規模資料,並且隨著資料量增大,模型的判別能力、學習能力會變得越來越強。但它同時也存在一些問題:一般依賴於大量高質量資料,不能適應不斷變化的條件,演算法的可解釋性也非常差。
當前的AI困境
現在,以深度神經網路為代表的第二代 AI 演算法存在基本方法層面的問題,我們比較 關注的有三點:不可靠、不安全、不可信。
不可靠主要指的是現行 AI 演算法非常依賴資料,基於大量樣本,每個樣本要有對應標籤,它的好處是可以做大資料分析,缺點是演算法非常依賴資料,演算法在訓練資料覆蓋到的場景上往往可以給出非常好的預測結果,包括人臉識別等都已經取得了很好的效果。但對於訓練資料沒有覆蓋到的場景,演算法有時會給出讓人匪夷所思的錯誤,特別是在實際應用場景中可能帶來危害的領域,比如無人車領域,特斯拉、Uber 等都出過事故,部分原因是由於 AI 識別或預測演算法出錯。這是第二代神經網路本質上的缺陷。
不可靠主要指的是演算法正常應用時存在的問題,不安全則是指當一些駭客或有惡意動機的人想惡意破壞演算法時,神經網路方法非常脆弱,比如對抗噪聲可以誤導影像識別演算法,給出錯誤的結果。這項技術如果使用在更加廣泛的關鍵場景 AI 系統上,會帶來非常大的危害。
不可信源於深度神經網路的不可解釋性。隨著網路變得越來越複雜,特別是網路結構 搜尋技術的誕生,這種網路結構對於人來說根本不可理解,當將其應用到一些比較關鍵的場景中,如醫療或金融場景,做比較重要的決策時,決策者很難信任神經網路給出的結果,因為神經網路並不會百分之百給出準確的結果,在演算法不可理解的情況下,人並不知道演算法何時會出錯,因此很難做出關鍵決策。
在這種情況下,清華大學提出了第三代人工智慧的概念。2016 年清華大學張鈸院士做了題為的“後深度學習時代的人工智慧”的報告,後來進一步總結為第三代人工智慧。
相比於第一代和第二代,第三代人工智慧是知識驅動+資料驅動,特點有三個:第一是可信,演算法能夠提供白盒化模型和可理解的決策依據;第二是可靠,能夠在各種情況下實現預測效果可靠提升;第三是安全性,演算法在受到惡意攻擊,或存在缺陷樣本時,仍然保持較高的判斷能力。如果符合這三點,我們認為就屬於第三代人工智慧。
RealAI業務實踐
前面主要介紹了第三代人工智慧的理念/目標,接下來介紹目前我們針對此目標進行的實踐和應用。
首先,上圖表示在實現了第三代人工智慧,或者是在安全、可靠、可信上實現突破之後,我們究竟可以有哪些應用。
比如當安全性更強時,我們可以實現更好的安防監控,實現更安全的監控,就可以對現行安防系統進行升級換代。現在的人臉識別技術在安全性場景下存在很大威脅,我們需要對它進行升級和保護。
在可靠性方面,工業製造、自動駕駛等領域都存在可靠性的問題。比如在工業製造領域,場景碎片化非常嚴重,這會導致樣本不足或標註質量差,對此,必須用新的方法進行升級,才能使得演算法在有噪音的資料上也能取得有價值的結果。同樣地,自動駕駛在訓練資料沒有覆蓋的情況下,需要提高演算法的判斷能力。
在可信性方面,如在我們現在所 關注的金融信貸風控、智慧投顧、醫療診斷等場景,需要提供更多可以讓人理解的判斷依據,以指導幫助人們做出決策。
為了實現這些目標,可以探索嘗試很多不同的技術路徑,RealAI 主要選擇的方向是貝葉斯深度學習,即將深度神經網路與貝葉斯機器學習相 結合。
貝葉斯機器學習是傳統的人工智慧方法,甚至比深度學習神經網路出現更早,該方法以貝葉斯定理為核心,好處是可以將人的經驗知識引入到決策裡,進行不確定性計算。近期,貝葉斯機器學習領域有很多發展。
貝葉斯機器學習一個典型的優勢是對隱含變數的建模與推斷,揭示背後規律。透過貝葉斯網路方法,基於圖論的結構化先驗知識,可以提升模型表達的靈活性,提高學習效率。與之相對的,深度神經網路有超強的擬合能力,可以對一些我們未知的分佈和關係可以做精準的擬合,將兩者 結合的貝葉斯深度學習方法,可以實現目前單獨透過兩者都無法實現的能力。
目前在貝葉斯深度學習領域,我們主要 關注三方面的技術,第一個是深度生成式模型,實現無監督或半監督學習,發現資料深層結構,同時提升可解釋性;第二個是貝葉斯神經網路方法, 結合神經網路擬合能力與資料不確定性特點,提升預測可靠性;第三個是 AI 安全技術,攻擊方面透過新增特定噪聲等方法干擾演算法輸出,防禦方面透過 AI 防火牆保護模型。
這是對第三代人工智慧技術方向的簡單介紹, 目前我們也在進行第三代人工智慧應用研發, 關注的領域主要集中在金融、工業、安全領域。
在金融領域,我們透過這些比較新的技術解決現行演算法解決不了的問題,比如最近我們正在研究一個有趣的問題——風控回撈解決方案,希望透過全新演算法實現無偏估計,提升金融機構的大資料風控水平。
在工業製造領域,我們也有應用新的技術。工業製造領域中一個典型的方法是工業視覺檢測,在光伏皮膚、手機皮膚生產等各個機器很難替代人工的環節,如果可以取代人工可以節省大量成本。但是,工業質檢場景不像人臉識別場景,它需要蒐集大量不同樣本,特別是很難收集的負樣本,但是因為生產裝置本身可靠性相對較高,產生負樣本的頻次較低,經過很長時間生產才能採集到資料量足夠大的負樣本。工業領域質檢環節需要專業的生產工人和專家來標註,不同人給出的標準也不完全一樣,這導致傳統的計算機視覺流程方法無法在工業視覺檢測上得到很好的應用。對於這個問題,我們透過半監督主動學習方法來改善,並在逐步研發無監督質檢方案。
另外,我們在工業領域的應用還包括工業時序預測,預測工業裝置執行過程中是否出現異常。如果能夠進行很好的預測,就可以讓廠商在裝置出現問題之前提早更換,減少維修成本和計劃外停機帶來的巨大損失。
AI安全領域進展與展望
最後想講講人工智慧的安全性問題,最近有很多 AI 應用帶來大量全新安全問題的案例。
比如最近有家公司做了一個 APP,讓使用者可以在影視片段中把自己的臉換進去,很好玩,但帶來了很大的隱私保護問題,有人質疑這是否會存在利用這種技術實現刷臉支付進行攻擊。對此,我們主要做了換臉攻擊和人臉識別檢測,目前來看檢測效果不錯,但隨著新的攻擊技術產生,檢測技術也面臨很多新的挑戰,需要大家在人工智慧檢測領域不斷進行技術迭代。
此外,我們還做了針對物體識別、影像識別的隱身術,比如當在一輛卡車模型車身上專門生成對抗噪聲貼紙圖案,就可以欺騙演算法模型,讓這輛車“隱身”,在快速移動場景下,車輛的隱身效果也很好。
對於手機來說,正常情況下駭客無法進行人臉解鎖,但佩戴我們做的一款眼鏡模型之後就可以輕鬆實現手機解鎖,這在目前比較主流的手機上得到了成功驗證。
所以,在第三代人工智慧時代,我們需要在安全性方面不斷探索,新的攻擊方法會帶來很多新的業務模式,比如 AI 產品安全認證、標準防火牆、一些更安全的 AI 演算法等。
為此,清華大學人工智慧研究院與我們一同做了RealSafe安全平臺,將AI 演算法、攻擊演算法等整合在平臺內,讓使用者快速使用,檢測自己的人工智慧演算法是否存在漏洞,並透過我們提供的標準化演算法,提升演算法的安全性。
最後,總結一下我今天的演講,共有三點:
1. 以深度學習為代表的 AI 演算法仍然存在侷限性,需要我們探索新的領域新的方向。
2. 貝葉斯深度學習方法可以帶來更加可信、可靠、安全的 AI 演算法。
3. 第三代 AI 將帶來全新的商業價值。