NO.1 什麼是知識圖譜?
知識圖譜本質上是語義網絡,是一種基於圖的資料結構,由節點(Point)和邊(Edge)組成。在知識圖譜裡,每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關係”。知識圖譜是關係的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的資訊(Heterogeneous Information)連線在一起而得到的一個關係網路。知識圖譜提供了從“關係”的角度去分析問題的能力。
知識圖譜這個概念最早由Google提出,主要是用來優化現有的搜尋引擎。不同於基於關鍵詞搜尋的傳統搜尋引擎,知識圖譜可用來更好地查詢複雜的關聯資訊,從語義層面理解使用者意圖,改進搜尋質量。比如在Google的搜尋框裡輸入Bill Gates的時候,搜尋結果頁面的右側還會出現Bill Gates相關的資訊比如出生年月,家庭情況等等。
另外,對於稍微複雜的搜尋語句比如 ”Who is the wife of Bill Gates“,Google能準確返回他的妻子Melinda Gates。這就說明搜尋引擎通過知識圖譜真正理解了使用者的意圖。
上面提到的知識圖譜都是屬於比較寬泛的範疇,在通用領域裡解決搜尋引擎優化和問答系統(Question-Answering)等方面的問題。接下來我們看一下特定領域裡的(Domain-Specific) 知識圖譜表示方式和應用,這也是工業界比較關心的話題。