知識圖譜——搜尋引擎的未來

ljrj123發表於2019-08-13

2012 年5月,谷歌知識圖譜一出激起千層浪,美國的微軟必應,中國的百度、搜狗等搜尋引擎公司在短短的一年內紛紛宣佈了各自的“知識圖譜”產品,如百度“知心“、搜狗“知立方“等。為什麼這些搜尋引擎巨頭紛紛跟進知識圖譜,在這上面一擲千金,甚至把它視為搜尋引擎的未來呢?這就需要從傳統搜尋引擎的原理講起。以百度為例,在過去當我們想知道“泰山”的相關資訊的時候,我們會在百度上搜尋“泰山”,它會嘗試將這個字串與百度抓取的大規模網頁做比對,根據網頁與這個查詢詞的相關程度,以及網頁本身的重要性,對網頁進行排序,作為搜尋結果返回給使用者。而使用者所需的與“泰山”相關的資訊,就還要他們自己動手,去訪問這些網頁來找了。
    當然,與搜尋引擎出現之前相比,搜尋引擎由於大大縮小了使用者查詢資訊的範圍,隨著網路資訊的爆炸式增長,日益成為人們遨遊資訊海洋的不可或缺的工具。但是,傳統搜尋引擎的工作方式表明,它只是機械地比對查詢詞和網頁之間的匹配關係,並沒有真正理解使用者要查詢的到底是什麼,遠遠不夠“聰明”,當然經常會被使用者嫌棄了。
    而知識圖譜則會將“泰山”理解為一個“實體”(entity),也就是一個現實世界中的事物。這樣,搜尋引擎會在搜尋結果的右側顯示它的基本資料,例如地理位置、海拔高度、別名,以及百科連結等等,此外甚至還會告訴你一些相關的“實體”,如嵩山、華山、衡山和恆山等其他三山五嶽等。當然,使用者輸入的查詢詞並不見得只對應一個實體,例如當在谷歌中查詢“apple”(蘋果)時,谷歌不止展示IT巨頭“Apple-Corporation”(蘋果公司)的相關資訊,還會在其下方列出“apple-plant”(蘋果-植物)的另外一種實體的資訊。
    從雜亂的網頁到結構化的實體知識,搜尋引擎利用知識圖譜能夠為使用者提供更具條理的資訊,甚至順著知識圖譜可以探索更深入、廣泛和完整的知識體系,讓使用者發現他們意想不到的知識。谷歌高階副總裁艾米特·辛格博士一語道破知識圖譜的重要意義所在:“構成這個世界的是實體,而非字串(things, not strings)”。

 


   
由靈玖軟體 研發的NLPIR語義智慧平臺KGB知識圖譜引擎,是基於漢語詞法分析的,採用KGB語法從結構化資料與非結構化文件中抽取各類知識,以完成語義智慧分析與知識推理及深度挖掘知識關聯的知識圖譜引擎。

KGB 知識圖譜引擎核心技術與特色:
   1 、 KGB知識抽取
  KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發的知識圖譜構建與推理引擎,基於漢語詞法分析的基礎上,採用KGB語法實現了實時高效的知識生成,可以從非結構化文字中抽取各類知識,並實現了從表格中抽取指定的內容等。
  KGB知識圖譜引擎可以定義不同的動作,增加、刪除、修改、抽取等等。每一類動作還能自定義各類後處理程式。
  2 、語義智慧分析
  NLPIR大資料語義智慧分析針對大資料內容採編挖搜的綜合需求,融合了網路精準採集、自然語言理解、文字挖掘和語義搜尋的最新研究成果,先後歷時十八年,服務了全球四十萬家機構使用者,是大資料時代語義智慧分析的一大利器。
  NLPIR大資料語義智慧分析十三大功能:精準採集、文件抽取、新詞發現、批次分詞、語言統計、文字聚類、文字分類、摘要實體、智慧過濾、情感分析、文件去重、全文檢索與編碼轉換。
  3 、語義精準搜尋
  JZSearch大資料語義精準搜尋引擎:是靈玖軟體聯合中科院與北理工的資訊檢索專家,針對大資料垂直搜尋需求的全文智慧檢索引擎,融合了自然語言理解、網路搜尋和文字挖掘的技術,透過人機互動、深度機器學習後具有一定的語義推理能力,是結合了人工智慧技術的新一代搜尋引擎,具有專業精準、高擴充套件性和高通用性的特點。


部分摘自《知識圖譜——機器大腦中的知識庫 》劉知遠


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31386431/viewspace-2653539/,如需轉載,請註明出處,否則將追究法律責任。

相關文章