知識圖譜——搜尋引擎的未來
2012
年5月,谷歌知識圖譜一出激起千層浪,美國的微軟必應,中國的百度、搜狗等搜尋引擎公司在短短的一年內紛紛宣佈了各自的“知識圖譜”產品,如百度“知心“、搜狗“知立方“等。為什麼這些搜尋引擎巨頭紛紛跟進知識圖譜,在這上面一擲千金,甚至把它視為搜尋引擎的未來呢?這就需要從傳統搜尋引擎的原理講起。以百度為例,在過去當我們想知道“泰山”的相關資訊的時候,我們會在百度上搜尋“泰山”,它會嘗試將這個字串與百度抓取的大規模網頁做比對,根據網頁與這個查詢詞的相關程度,以及網頁本身的重要性,對網頁進行排序,作為搜尋結果返回給使用者。而使用者所需的與“泰山”相關的資訊,就還要他們自己動手,去訪問這些網頁來找了。
當然,與搜尋引擎出現之前相比,搜尋引擎由於大大縮小了使用者查詢資訊的範圍,隨著網路資訊的爆炸式增長,日益成為人們遨遊資訊海洋的不可或缺的工具。但是,傳統搜尋引擎的工作方式表明,它只是機械地比對查詢詞和網頁之間的匹配關係,並沒有真正理解使用者要查詢的到底是什麼,遠遠不夠“聰明”,當然經常會被使用者嫌棄了。
而知識圖譜則會將“泰山”理解為一個“實體”(entity),也就是一個現實世界中的事物。這樣,搜尋引擎會在搜尋結果的右側顯示它的基本資料,例如地理位置、海拔高度、別名,以及百科連結等等,此外甚至還會告訴你一些相關的“實體”,如嵩山、華山、衡山和恆山等其他三山五嶽等。當然,使用者輸入的查詢詞並不見得只對應一個實體,例如當在谷歌中查詢“apple”(蘋果)時,谷歌不止展示IT巨頭“Apple-Corporation”(蘋果公司)的相關資訊,還會在其下方列出“apple-plant”(蘋果-植物)的另外一種實體的資訊。
從雜亂的網頁到結構化的實體知識,搜尋引擎利用知識圖譜能夠為使用者提供更具條理的資訊,甚至順著知識圖譜可以探索更深入、廣泛和完整的知識體系,讓使用者發現他們意想不到的知識。谷歌高階副總裁艾米特·辛格博士一語道破知識圖譜的重要意義所在:“構成這個世界的是實體,而非字串(things, not strings)”。
由靈玖軟體
研發的NLPIR語義智慧平臺KGB知識圖譜引擎,是基於漢語詞法分析的,採用KGB語法從結構化資料與非結構化文件中抽取各類知識,以完成語義智慧分析與知識推理及深度挖掘知識關聯的知識圖譜引擎。
KGB
知識圖譜引擎核心技術與特色:
1
、 KGB知識抽取
KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發的知識圖譜構建與推理引擎,基於漢語詞法分析的基礎上,採用KGB語法實現了實時高效的知識生成,可以從非結構化文字中抽取各類知識,並實現了從表格中抽取指定的內容等。
KGB知識圖譜引擎可以定義不同的動作,增加、刪除、修改、抽取等等。每一類動作還能自定義各類後處理程式。
2 、語義智慧分析
NLPIR大資料語義智慧分析針對大資料內容採編挖搜的綜合需求,融合了網路精準採集、自然語言理解、文字挖掘和語義搜尋的最新研究成果,先後歷時十八年,服務了全球四十萬家機構使用者,是大資料時代語義智慧分析的一大利器。
NLPIR大資料語義智慧分析十三大功能:精準採集、文件抽取、新詞發現、批次分詞、語言統計、文字聚類、文字分類、摘要實體、智慧過濾、情感分析、文件去重、全文檢索與編碼轉換。
3 、語義精準搜尋
JZSearch大資料語義精準搜尋引擎:是靈玖軟體聯合中科院與北理工的資訊檢索專家,針對大資料垂直搜尋需求的全文智慧檢索引擎,融合了自然語言理解、網路搜尋和文字挖掘的技術,透過人機互動、深度機器學習後具有一定的語義推理能力,是結合了人工智慧技術的新一代搜尋引擎,具有專業精準、高擴充套件性和高通用性的特點。
部分摘自《知識圖譜——機器大腦中的知識庫
》劉知遠
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31386431/viewspace-2653539/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 搜尋歷史、推理未來:時序知識圖譜上的兩階段推理
- 騰訊音樂知識圖譜搜尋實踐
- 知乎搜尋/(引擎)的故事
- 知識圖譜的器與用(一):百萬級知識圖譜實時視覺化引擎視覺化
- 知識圖譜01:知識圖譜的定義
- 知識圖譜|知識圖譜的典型應用
- 搜尋引擎漸行漸遠,未來路在何方
- KGB知識圖譜透過智慧搜尋提升金融行業分析能力行業
- 認識搜尋引擎 ElasticsearchElasticsearch
- 大眾點評搜尋基於知識圖譜的深度學習排序實踐深度學習排序
- 搜尋的未來是精品搜尋 | a16z
- 知識圖譜從哪裡來:實體關係抽取的現狀與未來
- 知識圖譜學習記錄--知識圖譜概述
- [小米集團未來星校招] 知識圖譜研究員 (急招)
- 【小米集團未來星校招】知識圖譜研究員 (急招)
- 知識圖譜技術的新成果—KGB知識圖譜介紹
- 【知識圖譜】 一個有效的知識圖譜是如何構建的?
- 搜尋引擎-03-搜尋引擎原理
- 知識圖譜之知識表示
- 圖資料和知識圖譜,數字化轉型的新引擎
- 57_初識搜尋引擎_分散式搜尋引擎核心解密之query phase分散式解密
- go 知識圖譜Go
- OI知識圖譜
- 56_初識搜尋引擎_核心級知識點之doc value初步探秘
- 知識圖譜學習
- Http/2知識圖譜HTTP
- 海量資料搜尋---搜尋引擎
- KGB知識圖譜,利用科技解決傳統知識圖譜問題
- 知識圖譜入門——知識表示與知識建模
- 【知識圖譜】知識圖譜資料構建的“硬骨頭”,阿里工程師如何拿下?深度學習在知識圖譜構建中的應用。阿里工程師深度學習
- 【知識圖譜】知識圖譜實體連結無監督學習框架框架
- 知識圖譜丨知識圖譜賦能企業數字化轉型
- 高效的使用搜尋引擎
- python 寫的搜尋引擎Python
- 機器之心轉載 | 知識圖譜從哪裡來:實體關係抽取的現狀與未來
- 知識圖譜和行業領域的結合產物-KGB知識圖譜介紹行業
- 事理圖譜,下一代知識圖譜
- 知識圖譜入門2