開源知識圖譜

趙丹 Diana Zhao發表於2014-01-16

昨天意外的得知,有兩個朋友發起了一個開源知識圖譜專案,以下是他們的介紹: http://zhonto.org,是一個開源中文知識圖譜的共建社群,致力於 建立一個開放的中文知識庫。

zhonto 有什麼用? 希望能夠為各類中文智慧應用,提供基礎支援。 業內的朋友,如果想做知識圖譜的技術嘗試、創業應用等,可能都沒有一個可以使用的知識庫,被這第一道坎就攔下了。 都聽說過國外Google,國內百度、搜狗等土豪有,可都是一個傳說。我等豪門之外,只能 望庫興嘆 啊。 so,為何不攢一個我們自己的知識庫?!

zhonto 能夠提供什麼? 您將可以訪問、檢索(還需加強)、瀏覽、編輯維護、下載(在準備中,缺服務資源)的中文知識庫。 為少量的應用請求,可以提供api支援。如果有大量應用請求,將提供資料和技術支援建立專有的服務。 先期將提供API服務和內容下載。後續將逐漸提供開源的支援庫,支援基於知識庫的應用及開發。

zhonto 裡面有什麼? 有4百多萬中文概念/詞條(有些內容還在裝載中)。 這些概念內部用Json儲存,API訪問可返回Json/RDF。

zhonto 內容來源? 目前都來自網路公開資源的自動抽取結果。 以後希望社群共同貢獻和維護,逐漸完善和擴充套件知識內容。 雖然現在看來,這個知識圖譜各方面都還簡陋,但是我覺得開源的方式天生適合人類知識的收集整理,開源知識圖譜未來會像維基百科一樣佔有一席之地。目前知識圖譜和維基百科非常相似,幾乎可以說就是把維基百科填入結構化資料表當中,把連結變成關係。未來的知識圖譜會有更強的形式化要求,會完整地表達物件以及物件之間的關係,在這方面,董振東老師的知網是最早的探索,但是知網的問題一個是封閉,因此就不可避免的帶有個人偏見,另一個是形式化的程度仍然不夠。未來依賴形式化知識的應用會越來越多,知識圖譜的價值就會越來越凸顯出來,也會對知識圖譜的形式化程度提出越來越高的要求。

相關文章