NLPIR利用知識圖譜技術提高智慧問答準確率

ljrj123發表於2020-01-21


語義搜尋、智慧問答是NLP的關鍵技術 ,目的是讓使用者以自然語言形式提出問題,深入進行語義分析,以更好理解使用者意圖,快速準確獲取知識庫中的資訊。 在使用者介面上,既可以表現為搜尋引擎的形式(語義檢索)、也可以為問答機器人的形式(智慧問答)。

在語義搜尋方面,使用知識圖譜技術 搜尋得到的資訊還可以經過加工後分門別類, 比如, 負面訊息彙總、熱點事件、併購事件、公司公告、研究報告、公司上下游、行業規模等等。

問答機器人(智慧問答系統)一般包括問句理解、資訊檢索、答案生成三個環節。 問答機器人與金融知識圖譜密切相關,知識圖譜在語義層面提供知識的表示、儲存和推理,問答機器人則從語義層面提供知識檢索的入口。基於知識圖譜的問答機器人相比基於文字的問答更能滿足金融業務實際需求。問答機器人的實現有很多案例,例如siri和微軟小冰,但是普遍的效果都不是很好,這個原因來源於他們是通識性的智慧助手,需要識別的語義實體太多,難以做到多輪對話、語義消歧的作用,如果只做行業的助手,那麼準確率會大大提升。

在發揮處理海量差異性資料優勢方面, KGB知識圖譜功能很好的發揮了大資料時代的知識圖譜構建優勢,能夠實現以 下幾種功能:

1.    文件解析: KGB知識圖譜引擎,可輕鬆解析多種格式與版本文件:TXT、DOC、EXCEL、PPT、PDF、XML等。尤其是PDF檔案,可直接解析輸出為word格式檔案,保留檔案中表格與文字格式等重要資訊。對於圖片資訊,OCR可自動識別並抽取圖片中的文字資訊。

2.    知識抽取:KGB知識圖譜引擎,可從結構化表格與非結構化文字中自適應識別並抽取關鍵知識(主體、客體、時間、地點、金額、條款等),準確率高達90%,實現知識的快速生成。

3.    知識關聯:KGB知識圖譜引擎深入挖掘知識關聯,將一個個知識實體連結為具有完整意義的知識事實。並具有強大的知識推理能力,推理出暗含的知識與結論,豐富知識圖譜。

4.    知識較驗:KGB知識圖譜加工廠能夠對知識質量智慧校驗,包括對多種知識錯誤與衝突進行自動智慧核查與修正,更有知識工程師進行知識精準校驗,保證知識圖譜的準確性。

在應用方面,KGB知識圖譜兼具以下特色:

1、跨領域可擴充套件:知識圖譜加工廠具有通用的圖譜構建引擎。知識抽取、知識關聯與質量核查過程不依賴特定業務知識,結合使用者知識圖譜構建的需求,可以快速構建使用者領域知識圖譜。

2、知識質量智慧核查:知識圖譜加工廠實現對多種知識錯誤與衝突的智慧核查與校驗,並對知識庫進行實時自動更新,保證知識圖譜準確性。

3、人機結合的服務:知識圖譜加工場人機構成:90%機器+10%的人工,只需要提供語料,就可以快速得到對應的知識圖譜構建成果。

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31386431/viewspace-2674194/,如需轉載,請註明出處,否則將追究法律責任。

相關文章