知識圖譜中的推理技術及其在高考機器人中的應用

周建丁發表於2016-07-28

本文來自東南大學教授漆桂林在攜程技術中心主辦的深度學習Meetup中的演講內容,介紹了知識圖譜中的推理技術及其在高考機器人中的應用。

隨著資訊化、網際網路化,如何在海量的資訊中獲取核心的知識體系、知識圖譜,並基於知識圖譜理清海量資訊的關係及結構,顯得越來越重要。

本文簡明地講述了知識圖譜的概念,回顧了知識圖譜的歷史,研究了知識圖譜中的推理技術及其在高考機器人中的應用,希望能做出輔助學生學習的智慧機器人。

什麼是知識圖譜

知識圖譜是一種圖資料模型組織的知識庫,節點為實體或者概念,邊為實體或者概念間各種關係。知識圖譜為實現人工智慧提供了常識知識和領域知識。

圖片描述

知識圖譜的歷史

知識圖譜來源於知識工程。知識工程的歷史回顧,可以追溯到六十年代Semantic Nets。到了八十年代專家系統,但由於知識瓶頸問題,在90年代受到的關注越來越小。Yahoo前首席科學家Ronald J. Brachman研究的KL-One系統是為了把Semantic Nets形式化。

Semantic Nets重新紅火是2000年左右,隨著Semantic Web的提出,智慧化的搜尋——語義搜尋被認為是下一代搜尋引擎,而Semantic Nets是語義搜尋的關鍵。從2010年開始,Google提出Knowledge Graph,使得知識工程受到了業界和學術界的廣泛關注。

圖片描述

知識圖譜的邏輯推理

知識圖譜的推理跟本體是相關的。什麼是本體?形式化的,對於共享概念體系的明確而又詳細的規範說明。本體提供的是一種共享詞表。或者說,就是一種特殊型別的術語集。只有把概念形式化,機器和人才能互動和理解。

圖片描述

比如,心臟是一種肌肉組織,是血液迴圈系統的一部分。心臟和肌肉組織是一種上下位的關係,和迴圈系統是部分與整體的關係。

本體的定義,有點像資料庫schema的定義,但更靈活。本體間的關係可以用類表示。比如獨奏音樂藝術家與藝術家之間有上下位的關係。上下位關係有傳遞性。另外我們有不相交的關係,一種東西不能既是火車又是汽車。蘊含的關係可以通過推理得出。

另外一個比較重要的邏輯推理是基於規則的推理,比如說產生式規則的推理。

基於統計的推理

結合統計推理,我們可以發現有些百科中的矛盾,大豆食心蟲既是動物,又是植物。另外,與深度學習比較緊密的是表示學習(Representation Learning)。

圖片描述

表示學習的基本思想:用低維的向量空間將每個實體都表示到空間裡面的某一個位置,從而可以利用空間中的距離來衡量實體之間的語義關係。E1,E2, … En代表所有實體,R1,R2, … Rn代表所有關係,故可以使用三維矩陣(張量)表示知識圖譜。還有Path Ranking Algorithm,根據路徑,預測人物之間的關係是否成立。

圖片描述

圖片描述

圖片描述

高考解題的應用

以空間推理為例。對於目前的大部分試題的圖片,現有的單一的空間推理模型(RCC、CSD、ICD)不足以表達足夠的空間關係。比如,美國與加拿大之間既存在拓撲關係,也存在方位關係。需將多種的空間推理模型結合,得到新的空間關係表示和推理模型。新的模型的表示、推理能力?應強於原有單一模型,但仍有待調研、測試。

空間推理模型需要擴充套件。

  1. 擴充套件表示方法。引入距離模型和其他空間模型(如上下左右的表示)。
  2. 擴充套件表示物件。動態物件的表示,線、點線面關係的表示,模糊物件的表示。

圖片描述

比如說,我們要分析地理岩層。我們要了解事實:石灰岩屬於沉積岩,頁岩屬於沉積岩,規則:沉積岩越往下形成年代越早,同層沉積岩形成年代一致。用來預測分析岩層屬於什麼巖。

圖片描述

圖片描述

圖片描述

最後強調,知識圖譜中的本體和規則是相當重要的。

演講PPT下載:

知識圖譜中的推理技術及其在高考機器人中的應用

攜程技術中心深度學習Meetup系列:

本文由攜程技術中心(微信公號ctriptech)童蘭利整理,並經過演講者本人確認和授權釋出。
責編:周建丁(zhoujd@csdn.net)


CCAI 2016中國人工智慧大會將於8月26-27日在京舉行,AAAI主席,多位院士,MIT、微軟、大疆、百度、滴滴專家領銜全球技術領袖和產業先鋒打造國內人工智慧前沿平臺,6+重磅大主題報告,4大專題論壇,1000+高質量參會嘉賓,探討人機互動、機器學習、模式識別及產業實戰。門票限時八折優惠中

圖片描述

相關文章