下一個十年:資料信仰與認知智慧

dicksonjyl560101發表於2018-11-26

下一個十年:資料信仰與認知智慧

 

https://blog.csdn.net/weixin_42137700/article/details/84523196

 

 

下一個十年,哪些技術將帶來革命性的改變?

 

在一個新技術層出不窮的時代,對於這個問題,恐怕大部分企業與組織都在積極思考。

 

百分點技術 副總裁兼首席架構師劉譯璟博士認為, 在產業數字化逐步深入的趨勢下,以自然語言處理(NLP)、知識圖譜為代表的認知智慧技術將會以場景為切入點,透過以點帶面、從區域性到整體、層層推進的方式實現突破,從而為數字世界的互動與決策帶來顛覆性改變。


 

為什麼認知智慧技術得到業界如此重視呢?這一切還得從資料開始說起……

 

// 資料信仰正在加速形成 //



 

尤瓦爾赫拉利曾在《未來簡史》中預言: 資料將成為人們未來的信仰。

 

現實情況中,企業與組織對於資料及其價值的認可度也在迅速提升。 業界普遍認為,資料正在成為一種新型的生產資料,是未來企業/組織業務運轉中不可或缺的要素。 一位製造業企業CIO在向筆者談到資料驅動業務時表示:“隨著研發、製造、倉儲、物流、服務等業務環節的資料全方位打通,為大資料、物聯網、人工智慧等技術的應用奠定了重要基礎,智慧製造已經不再是空想,未來將是資料進驅動業務。”

 

事實上,類似這樣的企業不佔少數。產業數字化和企業數字化轉型的大浪潮下,基於資料的能力正在加速顯現,並且得到越來越多使用者的認可。就如IDG《2018中國企業數字化發展報告》中提到,企業在數字化轉型過程中將逐步形成變革能力、敏捷能力、利用生態的能力、數字化產品與服務、資料資產化能力、經驗資料化能力,這一切的基礎就是資料。

 

劉譯璟博士直言, 用資料的角度去看待業務和現實,在觀念上是一個巨大的轉變,隨著數字化程度越來越高,一個與物理世界相對於的數字世界在加速形成,並且物理世界與數字世界之間的互動會愈發頻繁。因此,感知智慧、認知智慧等人工智慧技術將會有巨大的用武之地,使用者對於資料的信仰也將會加速形成。

 

// 從感知到認知:靠深度學習不夠 //

 



眾所周知,得益於算力大幅提升、資料愈發豐富以及以深度學習為代表的演算法突破,以影像識別、語音識別為代表的感知智慧技術近年來取得了突飛猛進的進步,並且在金融、零售、教育、安防、智慧城市等多行業與領域得到了應用。

 

不過,這還遠遠不夠。

 

從技術發展的角度來看,從感知智慧向認知智慧是必然趨勢,因為無論是影像中事物關係,還是語言中語義,都需要進行識別、理解,這恰恰正是認知智慧技術正在努力解決的事情;從現實的角度來看,認知智慧技術可以從海量資料中不斷挖掘、提煉和匯聚知識,人們渴望有更深層次的認知,從而更好地瞭解客觀世界。

 

在劉譯璟看來,感知智慧技術很快會在實際業務中遇到瓶頸,比如在語音識別中,如果只做文字層面的轉換,而不能從認知層面去理解文字/文字的含義,那麼對於使用者的價值其實並不高;未來一定需要從認知層面去理解視覺中動作的含義、文字中語義與含義,從而瞭解業務變化併為決策提供支撐。“從資料到資訊,再到知識,認知智慧技術將發揮至關重要的作用。”

 

對於深度學習,劉譯璟博士認為 ,深度學習技術的確是推動了感知智慧技術的快速發展,但是僅僅依靠深度學習技術是遠遠不夠的,深度學習是純粹基於資料的方法,屬於歸納的範疇,並不具有可解釋性,在一定階段後具有明顯的瓶頸,從感知智慧走向認知智慧,僅僅依靠深度學習是遠遠不夠的,還需要有更多突破。

 

// 認知智慧:到底應該如何突破? //



 

某種程度而言,認知智慧技術的發展並沒有像感知智慧那樣快速,依然有著眾多挑戰等待突破。

 

雖然近年來很多大公司在努力推動包括雲端計算、大資料、人工智慧技術的發展,構建出系列技術平臺,希望遮蔽掉底層技術的複雜性,推動包括認知智慧技術在內的應用發展,但在實際業務場景中應用並未取得令人滿意。

 

 

劉譯璟直言,人工智慧的變革需要場景應用來驅動。 正所謂是,獨立存在不是技術追求的目標,依託場景應用才是技術存在的真實意義。劉譯璟認為,以知識圖譜、自然語言處理為代表認知智慧技術的確還有很多需要突破的地方,長期在行業場景實踐中實現突破是最佳的方式。

 

對於任何一項新技術都不能在一開始就抱有不切實際的幻想。“不能過分誇大人工智慧技術現階段的能力,以自動駕駛位列,L5級別的自動駕駛現階段的確是非常難實現,因為它要求機器在任何時候都比人做的好。 但是我們可以先從一些特定場景中實現突破,繼而逐步實現更多場景的應用。像自動駕駛在目前城市計程車、園區接駁車這些場景中就已經得到實現和突破。 ”劉譯璟補充道。

 

“未來3-5年,認知智慧一定會取得更多突破。”劉譯璟表示,人工智慧進入到中期之後,將會更多的下沉到各個行業之中,將會更多更加具體的業務場景,意味著專業化程度會更高,可用的資料也將更少,專家和方法的重要性會大幅提高。“ 像知識工程、語義分析這些認知智慧層面的技術將再次興起。

 

在眾多認知智慧技術中,自然語言處理被認為是人工智慧皇冠上的明珠,而知識圖譜則被認為人工智慧的基石 ,那麼對於這兩項重要的認知智慧技術,未來又會有哪些具體挑戰?

 

// 如何讓 自然語言處理 綻放光芒? //



 

物理世界與數字世界之間的互動與交流,自然語言處理技術是必不可少。

 

筆者認為自然語言處理一定會在未來得到更多發展和應用。某種程度而言,自然語言處理正在重新定義人與機器,物理世界與數字世界之間的互動方式,過去依靠螢幕、鍵盤的互動方式,會越來越多被語音、動作所取代,這時就需要自然語言處理來理解、判斷和推理。

 

事實上, 自然語言處理技術已經在不同行業的多項業務中得到了初步的使用,比如智慧客服、智慧翻譯、智慧機器人等。 但是,從目前來看,大部分的應用的效果其實沒有符合大眾的期望值。業界也普遍認為,自然語言處理依然存在著很大的挑戰。



百分點首席演算法科學家蘇海波博士認為, 自然語言處理技術的突破的確是目前業界的巨大挑戰。在他看來,挑戰主要包括:帶標識資料嚴重不足、文字遷移、文字推理、多模態融合的文字理解等等。“現階段,沒有通用的自然語言處理技術。自然語言處理四個層面主要為:形式、語義、推理和語用,現階段自然語言處理在從語義到推理的階段發展。”

 

蘇海波博士介紹:“在語料足夠豐富的場景下,比如智慧問答、智慧客服等,深度學習藉助足夠的場景標註語料,自然語言處理是可以達到不錯的效果。但是百分點在大量實際客戶場景中發現,使用者面臨最實際的問題就是如何在標註樣本比較少的情況下,也能運用好深度學習技術,實現更佳的效果。”

 

根據蘇海波介紹, 業界目前的趨勢是融合,希望利用融合來實現自然語言處理技術的突破,比如Google提出的BERT預訓練語言模型,先去預先訓練和學習很多知識,然後融入到語言模型中,再結合使用者的具體場景,達到預想效果。“ 這種方式雖然標註樣本較少,但是同樣可以達到非常好的效果。”



蘇海波博士介紹,百分點目前也積極在一些客戶的場景中採用這種思路去提升NLP效果,並且取得了非常不錯的效果。“預訓練語言模型類似遷移學習的思想,把之前的學習遷移到不同的場景中,這將在本質上突破NLP。”

 

“自然語言處理的突破指日可待,未來它的黃金時代即將到來。”蘇海波博士表示。

 

// 知識圖譜:認知智慧的基石 //

 



如果說人工智慧面臨兩大難題,一是人機互動,那另外一個就是行業知識、專家資源的匱乏。

 

這也是知識圖譜的價值所在。 所謂知識圖譜,就是透過知識的關聯性形成一個網狀的知識結構,形成知識圖譜的過程本質是在建立認知,理解世界、應用或業務。機器透過知識圖譜可以更智慧地從客觀世界中獲得知識,從而更加智慧。



尤其是人工智慧技術越往行業中下沉,越會面臨著專業資料、知識匱乏的難題,缺乏相關訓練的資料來源。劉譯璟博士直言, 傳統機器學習都是歸納的方法。如果在一個新的領域,缺乏足夠的資料將會面臨冷啟動的問題,這時候就必須需要人的經驗和知識,將對業務的理解和認知告訴機器,這種對話就是知識圖譜, 當機器形成一定規模之後,就可以實現知識的共享。

 

“沒有人工,就沒有智慧。”目前,通用性知識圖譜已經逐漸構建成熟,而行業知識圖譜則剛剛興起。 如何構建一套適合這個行業比較有使用價值的知識圖譜,則必須藉助業務專家。劉譯璟表示:“在一個具體行業中,不可能像通用知識圖譜那樣去實現,必須藉助業務專家,有了本體之後去對接資料和應用。”

 

去年,百分點提出了動態知識圖譜的概念。劉譯璟強調,動態知識圖譜核心價值在於動態,即人對於業務的理解不是一層不變的,這種理解隨時隨刻都可能發生改變,動態知識圖譜就是可以快速反應出人的這種認知變化。

 

// 下一個十年:從這場釋出會開始! //

 



作為國內企業級大資料+人工智慧技術與應用服務商,百分點一直走在人工智慧應用的最前沿,多年以來專注於大資料作業系統、智慧認知產品以及智慧決策應用場景的落地,並致力於大資料、人工智慧技術在行業中的落地與應用,在大資料、認知智慧技術積累了豐富的實踐經驗。

 

 

 

11 月29日,百分點將釋出基於大資料+認知智慧技術的最新產品、成立認知智慧實驗室。此次新品的釋出,這將會是百分點在大資料+人工智慧領域的又一次沉澱。

 

對於認知智慧,一直走在實踐最前沿的百分點會給我們帶來什麼驚喜,敬請期待!

 

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29829936/viewspace-2221559/,如需轉載,請註明出處,否則將追究法律責任。

相關文章