GitHub開源史上最大規模中文知識圖譜

不脫髮的程式猿發表於2020-01-23

近日,一直致力於知識圖譜研究的 OwnThink 平臺在 Github 上開源了史上最大規模 1.4 億中文知識圖譜,其中資料是以(實體、屬性、值),(實體、關係、實體)混合的形式組織,資料格式採用 csv 格式。

到目前為止,OwnThink 專案開放了對話機器人、知識圖譜、語義理解、自然語言處理工具。知識圖譜融合了兩千五百多萬的實體,擁有億級別的實體屬性關係,機器人採用了基於知識圖譜的語義感知與理解,致力於最強認知大腦。自然語言處理工具包的功能有:中文分詞、詞性標註、命名實體識別、關鍵詞提取、文字摘要、新詞發現、情感分析等。

在 OwnThink 平臺首頁上滾動著各種關鍵詞,使用者也可輸入自己想要查詢的知識,然後就可以得出相應的知識圖譜。

OwnThink 知識圖譜還可以應用於機器人問答系統、知識推薦等等。下圖為知識圖譜在機器人上的應用。 

OwnThink支援線上API呼叫,感興趣的小夥伴可以調測使用,使用Python進行對話機器人簡單呼叫測試。

import json
import requests
sess = requests.get('https://api.ownthink.com/bot?spoken=中國')
answer = sess.text
answer = json.loads(answer)
print(answer)

效果如下:

GitHub地址:https://github.com/ownthink/KnowledgeGraphData

OwnThink網站地址:https://www.ownthink.com/

相關文章