【知識圖譜 趙軍 學習筆記】第二章 知識表示

JYNjyn666發表於2020-11-24

經典知識表示理論

邏輯

分為 命題邏輯、一階謂詞邏輯、高階謂詞邏輯

  • 命題邏輯具有最簡單的語法,定義了具有真假的原子命題,並可以通過與( ∩ \cap )、或( ∪ \cup )、非( ¬ \lnot ¬)、蘊含( ⇒ \Rightarrow )、當且僅當( ⇔ \Leftrightarrow )等邏輯連線符將多個原子命題合成複合命題,推理過程就根據邏輯連線詞的真值進行自動推導。
  • 一階謂詞邏輯:其在命題邏輯的基礎上引入了全稱量詞( ∀ \forall )和存在量詞( ∃ \exists )。一階謂詞邏輯的基本語法元素是表示物件、關係和函式的符號,其中物件對應常量符號,關係對應謂詞符號,函式對應函詞符號。物件是指一些事物的個體或者類別;關係或謂詞是指一種對映;函詞是指代表全函式的一種特殊的謂詞形式,它要求每一個定義域中的物件具有一個對映值
  • 高階謂詞邏輯:二階邏輯量化集合;三階邏輯量化集合的集合
  • 一階謂詞邏輯和高階謂詞邏輯之間的區別在於是否可以量化謂詞或者集合
  • ∀ x P \forall xP xP:表示對於每一個物件 x x x P P P為真
  • ∃ x P \exists xP xP:表示至少存在一個物件 x x x P P P為真
  • 缺點:難以表示過程性知識和不確定知識,且當表示知識中的屬性、謂詞和命題數量增大時,其推理過程會因為符號的組合爆炸問題,計算複雜性呈指數級增長,∴基於謂詞邏輯的推理過程比較耗時、工作效率極低

語義網路

語義網路是一個通過語義關係連線的概念網路,將知識表示為相互連線的點和邊的模式。節點表示實體、事件、值等,邊表示物件之間的語義關係。
可用三元組形式來表示:<節點1,關係,節點2>,這樣來表示節點1和節點2之間的語義關係
語義網路中的關係有:

  • 例項關係(ISA):體現的是“具體與抽象”的概念,含義為“是一個”,表示一個事物是另一個事物的例項
  • 分類關係(AKO):體現的是“子類和超類”的概念,含義為“是一種”,表示一個事物是另一個事物的一種型別
  • 成員關係:體現的是“個體與集體”的關係,含義為“是一員”,表示一個事物是另一個事物的一個成員
  • 屬性關係:指事物和其屬性之間的關係。常用的屬性關係有:Have,表示一個節點具有另一個節點所描述的屬性;Can,表示一個節點能做另一個節點的事情; . . . . . . ...... ......
  • 聚合關係:即包含關係,指具有組織或結構特徵的“部分與整體”之間的關係
  • 時間關係:是指不同事件在其發生時間方面的先後次序關係,常用的時間關係有“在前”(表示一個事件在另外一個事件之前發生)和“在後”(表示一個事件在另外一個事件之後發生)
  • 位置關係:是指不同事物在位置方面的關係,常用的位置關係有:“在”(表示某一物體所在的位置),“在上”(表示某一物體在另一物體之上),“在下”(表示某一物體在另一物體之下),“在內”(表示某一物體在另一物體之內),“在外”(表示某一物體在另一物體之外)
  • 相近關係:是指不同事物在形狀、內容等方面相似或接近

一元謂詞: P ( x ) P(x) P(x) P P P表示實體/概念的性質、屬性等;二元謂詞: P ( x , y ) P(x,y) P(x,y) x x x y y y為實體, P P P表示實體之間的關係
優點:語義網路用最簡單的一種統一形式描述所有知識,有利於計算機的儲存和檢索
缺點:僅用節點及其關係描述知識,推理過程需要針對不同關係做不同處理,推理方法還不完善。

框架

採用人類的記憶儲存結構,即當面臨一個新事物時,人就從記憶中找出一個合適的框架,並根據實際情況對框架中的具體值進行填充。填充的部分稱為槽,而框架以及槽的粒度是根據人類對事物認知程度而定。
框架對所有事物進行抽象,並用來表示事物各方面的屬性以及事物之間的類屬關係
槽可以是任何形式的資訊,包括原子值或值的集合,對於非原子的槽,可以由多個側面對槽的描述進行描述。 ⇒ \Rightarrow 更立體更準確地描述事物的屬性與關係。
但在一些基於框架的系統中,省略了側面的定義而直接表示為平鋪式的槽結構:FrameNet
FrameNet在框架之間定義了八種關係:

  • 繼承關係
  • 視角關係
  • 子框架關係
  • 前置關係
  • 使動關係
  • 因果關係
  • 使用關係
  • 參考關係

指令碼

與框架類似的知識表示方法,其通過一系列的原子動作來表示事物的基本行為,按照時間順序描述事物的發生。指令碼表示的知識有確定的時間或因果順序,必須是前一個動作完成之後才會觸發下一個動作的開始
描述的是一個動態的過程而非靜態知識的表示方法
一個完整的指令碼應該包括以下幾個重要的組成部分:

  • 進入條件:指出指令碼所描述的事件可能發生的先決條件,即事物發生的前提條件
  • 角色:描述事件中可能出現的人物
  • 道具:描述事件中可能出現的相關物體,主要指人物角色在完成動作時的使用的工具
  • 舞臺:指令碼中事件發生的空間
  • 場景:事件發生的序列。場景並不是單一的動作序列,而是可以存在多個可能的分支 列舉會是一個龐大的工程 ⇒ \Rightarrow 指令碼表示法的缺點
  • 結局:給出在劇本描述的事件發生之後通常所產生的結果,對應著進入後續指令碼的先決條件

語義網中的知識表示方法

語義網知識描述體系

XML

XML的內容通過元素(e.g:人物、組織、事件等)來記錄,元素都帶有標籤。元素的標籤必須是字母、下劃線或冒號,標籤含有的內容可以使文字、數值、時間甚至為空。元素可以有巢狀結構,巢狀的深度不受限制
【例】

<人物>
	<名字>馬克斯</名字>
	<國籍>德國</國籍>
	<專業>物理學家</專業>
	......
</人物>	

優勢:靈活

RDF

RDF假定任何複雜的語義可以通過若干個三元組的組合來表達,並定義這種三元組的形式為“物件-屬性-值”或“主語-謂詞-賓語”
RDF侷限於二元謂詞,RDFs侷限於子類和屬性層次及其屬性的定義域

OWL

OWL在RDF和RDFs的基礎上定義了自己獨有的語法,主要包括頭部和主體兩部分
頭部:OWL描述一個本體時,會預先制定一系列的名稱空間,並使用名稱空間中預定義的標籤來形成本體的頭部
主體:用來描述本體的類別、例項、屬性之間相互關聯的部分。核心部分

知識圖譜中的知識表示方法

表示框架

一個知識本體主要涵蓋以下幾個方面的內容:

  • 事物:客觀世界中的實體或物件
  • 概念:具有相似本體特徵的一類事物
  • 屬性:事物或概念具有的特徵和特性等
  • 關係:概念與實體之間的關聯方式
  • 函式:事物或概念之間進行轉化的形式表達
  • 約束:某項斷言成立的限制條件的形式化描述
  • 規則:依據某項斷言得到邏輯推論的因果關係知識的形式化描述
  • 公里:永遠為真的斷言

知識圖譜的數值化表示方法

  • 符號的數值化表示
  • 文字的數值化表示
  • 知識圖譜的數值化表示
    –RESCAL

相關文章