人工智慧作為一項賦能技術,如今已在多個行業領域逐步落地應用,不過現階段,人工智慧在某些方面仍然處於技術提升期。本文將聚焦於人工智慧的學術研究方面,簡要探討一下AI學術前沿和技術發展趨勢。
人工智慧熱門技術研究課題
當前人工智慧在諸多行業領域已經實現了廣泛應用,但在熱門技術方面來看,安全性等方面依然存在一定缺陷。 用簡單的“對抗性補丁”(adversarial patch)可以使得人臉識別在可靠性、安全性等失效。這也讓AI技術研究需要更加註重 人工智慧 “攻”和“防”的課題,如何確保AI演算法的高安全性、可靠性還有它的魯棒性,人工智慧演算法在安全方面 “攻”和“防”當前也是一個相當熱門的技術研究方向。
另外一個研究課題是 生成對抗網路(GAN, Generative Adversarial Networks ),生成對抗網路有非常多的應用,典型的應用在“影像生成”和“資料增強”等方面,比如在安防領域人臉識別影像的生成。生成對抗網路如今也逐漸被應用在其他的一些應用領域,如生命科學中的材料設計,還有食品、藥物的設計,這些也成為人工智慧技術新的研究方向。
邊緣計算同樣也是當下人工智慧技術研究的重點之一。隨著物聯網時代的到來,越來越多的資料在邊緣端產生,邊緣計算由此成為顯著趨勢。現階段邊緣計算有多種計算方式決定什麼應該放在邊緣端。目前人工智慧的演算法在主流方面是把演算法放在雲端,把程式設計中推理的部分放在邊緣端,這樣可以保證資料運算和訓練這一類需要大功率運算的過程在雲端進行,而推理的過程則在邊緣端發生。不過這種模式可能會導致邊緣端的演算法不夠智慧,如何在邊緣端提升演算法的智慧程度是一個重要的研究方向。
寬度學習網路的誕生,被認為是可以很好地替代原本的深度學習網路,它基於將輸入隨機對映成為擴充節點作為輸入的思想而設計(依據早期隨機向量函式連結神經網路,random vector functional-link neural network)。它可以非常快速的算出正確的對映,在資料的增量部分也可以實時的學習。 根據大量的測試結果顯示,在邊緣計算過程中,寬度學習的實時性應用效果非常不錯。
人工智慧在理論上的瓶頸問題
譚鐵牛院士曾表示現階段的人工智慧依然存在很大的侷限性,用四句話概括便是:有智慧沒智慧,有智商沒情商,會計算不會“算計”,有專才無通才。具體解釋一下在理論上侷限的瓶頸問題主要包括:
(1) 資料瓶頸:深度學習需要大量的資料;(2) 泛化瓶頸:這是模式識別、計算機視覺、人工智慧方法面臨的一個共同的問題,現有方法在一些實際問題中仍無法取得理想的泛化效能,或者訓練好的模型用在變化的環境或領域其泛化效能明顯下降;(3) 能耗瓶頸:人的大腦儘管是一個通用的人工智慧系統但是能耗很低(只有20瓦),但現有計算機上實現的人工智慧系統能耗很高;(4) 語義鴻溝瓶頸:目前語言服務大多為簡單查詢,不涉及語義推理問題,缺乏真正的語言理解能力,比如一些有歧義的自然語言句子,人很容易根據上下文或常識理解其真正含義,計算機卻很難理解;(5) 可解釋性瓶頸:現有人工智慧系統都是知其然而不知其所以然,其過於依賴訓練資料,缺乏深層次資料語義挖掘。因此,可解釋性非常重要,人工智慧不僅要知其然還要知其所以然,知其然只是淺層智慧,知其所以然才叫深層智慧;(6) 可靠性瓶頸:現有人工智慧系統可靠性較差,有些錯誤識別結果會帶來致命後果,尤其在自動駕駛這樣的領域。
人工智慧值得關注的技術研究方向
為了更好地破除上述人工智慧技術研究的瓶頸問題,在AI學術研究領域,一些新的技術發展趨勢和研究方向也值得關注,包括:
(1) 從專用人工智慧到通用人工智慧是大勢所趨,一些科技巨頭包括國家機構都在佈局通用人工智慧的研究,微軟成立人工智慧實驗室以挑戰通用人工智慧為主要目標;
(2) 可解釋的人工智慧系統備受關注,也將成為突破統計學習瓶頸問題的一個重要方向。DARPA的報告:第一個波次是基於規則的,例如以專家系統為代表的系列方法和技術;第二個波次就是當前以大資料驅動為代表的統計學習;同時,他們認為第三個波次很可能是可解釋的人工智慧,就是人工智慧要知其然還要知其所以然,以此可見人工智慧可解釋性的重要意義;
(3) 小樣本甚至零樣本學習成為提高人工智慧系統泛化能力的一個重要方向。最近提出的生成對抗網路、膠囊網路、生成模型等都是為了降低對訓練資料的需求,提高人工智慧系統泛化能力的有益嘗試;
(4) 非深度神經網路計算模型成為機器學習創新的一個重要方向。當前深度學習理論基礎薄弱、模型結構單一、資源消耗過高、資料依賴性強,以非神經網路、資源節約型機器學習模型有望成為下一個突破口;
(5) 腦科學與人工智慧深度融合、協同發展、相得益彰,IBM的TrueNorth晶片、美國DARPA的MICRONs研究專案以及最近Science和Nature雜誌上發表的一些受腦啟發的智慧計算模型都是這方面的典型例子。
寬度學習(BLS)網路的研究和應用
除了上述這幾大AI學術研究要點之外,還有寬度學習(BLS)網路也值得重點關注。寬度學習(BLS)自2018年由我們(陳俊龍教授及其團隊)首次在學術界提出,便迅速在科研機構(中科院)、國內知名高校及企業展開了較為廣泛的研究與應用。
雖然深度學習網路非常強大,但大多數網路都被極度耗時的訓練過程所困擾。首先深度網路的結構複雜並且涉及到大量的超引數。另外,這種複雜性使得在理論上分析深層結構變得極其困難。另一方面,為了在應用中獲得更高的精度,深度模型不得不持續地增加網路層數或者調整引數個數。為了克服這些問題, 寬度學習系統提供了一種深度學習網路的替代方法,同時,如果網路需要擴充套件,模型可以透過增量學習高效重建。
寬度學習(BLS)在設計思路方面,首先,利用輸入資料對映的特徵作為網路的「特徵節點」;其次,對映的特徵被增強為隨機生成權重的「增強節點」;最後,所有對映的特徵和增強節點直接連線到輸出端,對應的輸出係數可以透過快遞的偽逆得出(或者梯度下降方法)。BLS 最重要的特點在於它的單隱層結構,具有兩個重要的優勢,一個是「橫向擴充套件」,另一個則為「增量學習」,與深度神經網路不同之處在於,BLS 不採用深度神經網路的結構,而是基於單隱層神經網路構建,可以用「易懂的數學推導來做增量學習」。
直白來講, 深度神經網路學習架構是在結構固定以後才開始學習,此後學習期間如果出現不準確情況,就要重新設計網路、再學習一次。而寬度學習則是設計好網路後,當面臨學習不準確的情況,可以隨時以橫向的方式進行增量擴充,即透過增加神經元,以提高準確度。這種增量學習的模式也適用在資料實時的進入已訓練成的神經網路模型當中,而不用重新對整個收集的資料再重新訓練。
在安防領域,寬度學習網路的應用主要表現在兩個方面:一是 提升人工智慧識別的可靠性。比如在人臉識別演算法訓練過程中,最好的資料當然是高畫質正臉無遮擋的乾淨人臉資料,但實際上測試推理過程中,很多的人臉資料並不完美,會出現被遮擋(墨鏡、口罩)、模糊、非正臉角度的人臉照片。在做演算法訓練過程中,我們可以基於寬度學習網路架構,透過將乾淨人臉圖片和缺陷人臉圖片融合到一起做訓練,甚至可以特意生成一些有缺陷的圖片樣本,由此來提高演算法對缺陷圖片的識別準確率,從而提升複雜場景下人臉識別演算法的場景適應能力。二是 解決資料標註的問題,在人工智慧演算法訓練過程中,資料的標註也非常重要,如果標註錯誤,那麼不管演算法有多精確,訓練的結果也不會理想。透過寬度學習網路構建的演算法模型,可以很好地解決演算法標註錯誤的問題。
透過研究團隊的大量測試,可以看出寬度學習(BLS)以及它的各種變體和擴充套件結構具有良好的發展潛力,在實際應用中表現出其快速且高精度的優秀效能。目前寬度學習在很多技術領域都有展開應用,比如時間序列、高光譜分析、腦機訊號分析、容錯、基因鑑定與疾病檢測、步態識別、3D列印以及智慧交通等。隨著人工智慧技術研究的持續深入,寬度學習這種不需要深度結構的高效增量學習系統有望加速助推人工智慧的發展。