知識圖譜技術的新成果—KGB知識圖譜介紹

ljrj123發表於2019-10-22

 

知識圖譜本質上是一種大規模的語義網路。從2012年穀歌提出知識圖譜,知識圖譜一直在快速發展,其應用也不再侷限於“語義網路”範疇。

現如今的知識圖譜在實際應用中,主要作為大資料時代的知識工程出現。和傳統的知識圖譜工程相比,其使用效果主要是受到其資料規模的影響。大資料時代,受益於海量資料、強大的計算能力和群智計算,知識圖譜能夠自動構建大規模、高質量的知識庫,從知識規模的量帶來質的改變。

網際網路時代的資料分析存在一些特有特點:1. 資料規模巨大,個體之間差異帶來了巨大的差異性資料 2. 資料的精度不高,資料分析需要大量資料。

在對這種網際網路海量差異性資料進行處理時,傳統的知識圖譜工程弊端也凸顯出來。傳統知識庫構建主要依靠人工構建、代價高昂、規模有限,投入極大且效率不高。同時,傳統知識圖譜不具有深度知識結構,無法解決專業的業務問題。網際網路時代急需自動化、智慧化構建行業知識圖譜的工具   ,將專業領域知識賦予機器,讓機器代替業務人員從事簡單知識工作,實現重複性、基礎性勞動的智慧化過程,進而適應網際網路時代的大規模開放應用的需求。

在發揮處理海量差異性資料優勢方面,KGB知識圖譜功能很好的發揮了大資料時代的知識圖譜構建優勢,能夠實現以下幾種功能:

1.  文件解析: KGB知識圖譜引擎,可輕鬆解析多種格式與版本文件:TXT、DOC、EXCEL、PPT、PDF、XML等。尤其是PDF檔案,可直接解析輸出為word格式檔案,保留檔案中表格與文字格式等重要資訊。對於圖片資訊,OCR可自動識別並抽取圖片中的文字資訊。

2.  知識抽取:KGB知識圖譜引擎,可從結構化表格與非結構化文字中自適應識別並抽取關鍵知識(主體、客體、時間、地點、金額、條款等),準確率高達90%,實現知識的快速生成。

3.  知識關聯:KGB知識圖譜引擎深入挖掘知識關聯,將一個個知識實體連結為具有完整意義的知識事實。並具有強大的知識推理能力,推理出暗含的知識與結論,豐富知識圖譜。

4.  知識較驗:KGB知識圖譜加工廠能夠對知識質量智慧校驗,包括對多種知識錯誤與衝突進行自動智慧核查與修正,更有知識工程師進行知識精準校驗,保證知識圖譜的準確性。

在實現對專業性較強的資料進行處理方面,KGB知識圖譜兼具以下特色:

1、跨領域可擴充套件:知識圖譜加工廠具有通用的圖譜構建引擎。知識抽取、知識關聯與質量核查過程不依賴特定業務知識,結合使用者知識圖譜構建的需求,可以快速構建使用者領域知識圖譜。

2、知識質量智慧核查:知識圖譜加工廠實現對多種知識錯誤與衝突的智慧核查與校驗,並對知識庫進行實時自動更新,保證知識圖譜準確性。

3、人機結合的服務:知識圖譜加工場人機構成:90%機器+10%的人工,只需要提供語料,就可以快速得到對應的知識圖譜構建成果。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31386431/viewspace-2660978/,如需轉載,請註明出處,否則將追究法律責任。

相關文章