基於知識圖譜的知識泛化讓AI學會“舉一反三”

極天資訊發表於2020-12-08

比爾·蓋茨曾說“自然語言處理是人工智慧皇冠上的明珠”。在上週剛結束的“2019CCF-GAIR全球人工智慧與機器人峰會”上,微軟亞洲研究院副院長周明博士指出“人在理解的時候有常識、有背景,所以能夠理解;可電腦沒有常識、沒有背景,只是根據字面來處理,因此它理解的都是一樣的。這就是自然語言處理的難處。”確實,人類的“智慧”是在適應和理解複雜多變的物理和社會環境的過程中進化而來, 並非只適用於解決具有明確規則的任務或遊戲。而當前,如何讓機器能夠像人一樣思考,能夠理解、解釋並進行推理決策,即獲得人類所獨有的認知能力,是人工智慧當前面臨的重大挑戰。而知識圖譜則為認知智慧的發展提供了全新的視角和機遇。

 

語言理解的難度:詞完全一樣,意義截然相反

人類智慧具有快速學習和靈活遷移的特點,在應對複雜多變的外部環境時較人工智慧系統表現出不可比擬的優勢。該優勢主要源於人類具備良好的知識表徵。對良好的知識表徵——知識圖譜的深入研究不僅可以提升認知智慧,同時也有助於實現當前人工智慧系統從“大資料、小任務”到“小資料、大任務”的轉變。使人工智慧系統像人一樣具備小樣本學習的能力。

那麼在實際應用中,知識圖譜是如何輔助AI實現這一過程的呢?其核心就在於利用知識圖譜進行知識泛化。泛化(generalization)這一概念最早出現在巴甫洛夫的《大腦半球的功能講義》(1926),用來表示條件反射的普遍化性質。在心理學中,泛化是學習理論中的一個基本原則,語義條件反應的泛化是僅見於人類的一種泛化現象,它極大地增進了人類學習的效果。而知識泛化就是利用知識圖譜,將一個實體具體表達泛化為多樣性表達,將一個實體泛化為一類實體。簡單來說就是,通過知識泛化讓AI具有“舉一反三”的能力。

以極天資訊多年實戰經驗為例。基於政務知識圖譜、依託G1Brain類腦平臺,極天資訊為某政務服務中心打造了新一代政務智慧諮詢服務機器人,能夠模擬政務專家,全渠道、7*24小時,以多輪互動的方式,就戶政、社保、出入境、納稅、創業就業等各類問題給市民提供智慧化的專業政務諮詢,將進一步提升區級政務服務智慧化水平。比如“港澳臺人員如何辦理養老金手續?”這個問題,普通民眾一眼就知道“港澳臺”包括了“香港、澳門、臺灣”,但是如何才能讓計算機也能夠立馬明白其中可能包含的各種同義詞、所屬關係,能夠“舉一反三”呢?這就需要利用知識圖譜對其進行知識泛化。問句主體為“港澳臺人員”,知識泛化之後主體可以包含“臺灣人員/臺灣同胞/臺灣市民”“香港人員/香港市民”或者“澳門人/澳門市民”;而問句中的動作為“辦理”,可以泛化為同義詞“申請、辦、申辦、領取、領”等等,經過包含關係與同義詞關係的知識泛化後預計可以得到上百條相似問題。這樣就保證了無論諮詢人員如何提問,AI都能夠快速而準確地識別意圖,真正“理解”諮詢人員的需求,從而獲取到最直接的答案。從這樣一個簡單例子即可知,通知知識泛化可有效提升政務諮詢體驗。

 

極天資訊知識泛化

 

極天資訊政務知識圖譜

十多年來,極天資訊持續專注自然語言理解(NLP)、語義網(本體、Ontology)和知識圖譜相關技術的創新研究,打造了“軟體+方法+模型”三位一體知識圖譜服務體系,可以高效打造各個行業領域的智慧化應用。

具體包括了軟體——知識圖譜構建工具與解析引擎G1Brian類腦平臺;方法——半自動化知識圖譜構建的極天七步法;模型——涵蓋萬事萬物的SemNet通用知識圖譜、100+領域知識圖譜與各類規則模型。並於2012年極天資訊與中山大學資訊管理學院共建“智慧資訊處理實驗室”,致力於知識圖譜及相關演算法研究。當前,極天資訊“三位一體”知識圖譜服務已經在運營商、出版、政務、金融、電力、法律、教育等多個領域,展開了智慧審批、智慧文字分析、智慧知識庫、智慧搜尋與推薦、智慧問答等一系列成熟的應用,推動了大量商業實踐的成功。

相關文章