清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

AMiner学术头条發表於2019-01-29

2019年1月21日,清華大學人工智慧研究院在清華大學FIT樓舉行了知識智慧研究中心成立儀式暨知識計算平臺釋出會,清華大學副校長、清華大學人工智慧研究院管委會主任尤政院士,人工智慧研究院院長張鈸院士、常務副院長孫茂松教授出席了儀式並致辭。

在此次釋出會上,我國知識計算領域專家李涓子做了學術報告,介紹XLORE多語言知識圖譜

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

文末附PPT及演講影片

XLORE簡介

XLORE是融合中英文維基、法語維基和百度百科,對百科知識進行結構化和跨語言連結構建的多語言知識圖譜,是中英文知識規模較平衡的大規模多語言知識圖譜知識圖譜以結構化的形式描述客觀世界中概念、例項、屬性以及它們之間豐富的語義關係。XLORE中的分類體系基於群體智慧建立的維基百科的Category系統。XLORE包含16,284,901個的例項,2,466,956個概念,446,236個屬性以及豐富的語義關係。

Xlore三大特點:

(1)聚力了兩大中文百科中英文平衡的圖譜。

(2)具有更豐富的語義關係,基於isA關係驗證。

(3)擁有多種查詢介面,助力第三方使用。

發展情況:

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

團隊介紹:

團隊成員主要包括:

• 李涓子

清華大學知識工程實驗室負責人,清華大學計算機系教授,中國中文資訊學會語言與知識計算專委會主任、中國計算機學會術語委員會執行委員。

知識圖譜,新聞與社會網路挖掘

• 張鵬:系統設計

• 侯磊:新聞挖掘,知識圖譜

• 金海龍:表示學習,實體分類

• 呂鑫:表示學習,知識推理

應用案例:

實體連結系統 Entity Linking System

XLink是基於跨語言知識庫XLORE的實體連結系統,使用者輸入一篇文字文件(如新聞、部落格等),XLink識別出文件中的實體並連結到XLORE相對應的實體上。實體連結將文字資訊和知識庫橋接起來,為文字理解提供了外部知識,同時,幫助讀者理解有歧義的、生僻的實體,提高文字理解能力。

新聞事件分析挖掘和搜尋系統實體連結系統 NewsMiner

使用最前沿的自然語言處理機器學習深度學習方法從語義層面分析新聞資料,同時處理中英文新聞資料,並實現語義級跨語言內容聚合對齊。全新的事件-話題-實體新聞表示模型擺脫傳統新聞平面式展示和閱讀體驗。千萬級百科知識庫(XLORE)為基礎讀者提供更為豐富的背景知識。

應用服務:

XLORE API

XLORE API是為xlore.org設計開發的線上跨語言知識圖譜資料服務API。

包括詞條檢索、關鍵字檢索、概念檢索、例項檢索、先關機構人物檢索、實體關係檢測。

詞條檢索

使用URI作為引數從XLORE中獲取URI指定的詞條資訊:包括名稱(Label),上級概念(Super Class), 相關概念(Related Class),Infobox(Property),摘要(Abstract),型別(Type)。

關鍵字檢索

使用關鍵詞作為條件模糊查詢XLORE,獲取可能的概念(Class)或者例項(Instance)。

概念檢索

使用關鍵詞為條件查詢XLORE中的概念(Class),並獲得概念的簡要資訊,包括概念的名稱(Label),URI 上級概念(Super Class)、下級概念(Sub Class)和例項(Instance)。當結果多餘10個時,僅返回前10條。

例項檢索

使用關鍵詞為條件查詢XLORE中的例項(Instance),並獲得例項的簡要資訊:包括例項的名稱(Label), URI和型別(Type),相關概念(Class)和相關例項(Instance)。當結果多於10個時,僅返回前10條。

相關機構人物檢索

使用URI為條件查詢XLORE中的概念(Class)、例項(Instance)的相關機構和人物例項,並獲得例項的簡要資訊:包括例項的名稱(Label), URI和型別。當結果多於10個時,僅返回前10條。

實體關係預測

近一年API呼叫174餘萬次,覆蓋了58個國家或地區,國內129個城市。

XLINK

  • XLink是基於跨語言知識庫XLORE的實體連結系統。

  • XLink能夠識別出使用者輸入的文字文件(如新聞、部落格等)中的實體,並連結到XLORE相對應的實體(概念、例項)上。

  • XLink將文字資訊和知識圖譜橋接起來,為文字理解提供了外部知識。同時,XLink幫助讀者理解有歧義的、生僻的實體,提高文字理解能力。

相關比較

與國際著名知識圖譜資料比較:

  • DBpedia—最早的維基類知識圖譜

  • Freebase—Google知識圖譜的核心

  • YAGO和BabelNet—2017年IJCAI卓越論文獎

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

PPT具體內容:

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

清華大學李涓子教授 : THUKC世界知識圖譜——XLORE

演講影片

清華大學知識智慧研究中心釋出會(上)

清華大學知識智慧研究中心釋出會(下)

AMiner學術頭條
AMiner學術頭條

AMiner平臺由清華大學計算機系研發,擁有我國完全自主智慧財產權。系統2006年上線,吸引了全球220個國家/地區800多萬獨立IP訪問,資料下載量230萬次,年度訪問量1000萬,成為學術搜尋和社會網路挖掘研究的重要資料和實驗平臺。

https://www.aminer.cn/
專欄二維碼

相關文章