Lucene : 基於Java的全文搜尋引擎

2015-07-05    分類:開源軟體、搜尋引擎、程式設計開發0人評論發表於2015-07-05

本文由碼農網 – 小峰原創,轉載請看清文末的轉載要求,歡迎參與我們的付費投稿計劃

Lucene是一款基於Java的全文檢索引擎,跟Sphinx相比,Lucene的功能更為強大,應用面也更加廣闊。目前市面上也有不少全文搜尋引擎也是基於Lucene實現的,比如Elastic Search、Solr、Luke等。

Lucene的特點

下面是Lucene的一些優點,摘自百度百科

  • 索引檔案格式獨立於應用平臺。Lucene定義了一套以8位位元組為基礎的索引檔案格式,使得相容系統或者不同平臺的應用能夠共享建立的索引檔案。
  • 在傳統全文檢索引擎的倒排索引的基礎上,實現了分塊索引,能夠針對新的檔案建立小檔案索引,提升索引速度。然後通過與原有索引的合併,達到優化的目的。
  • 優秀的物件導向的系統架構,使得對於Lucene擴充套件的學習難度降低,方便擴充新功能。
  • 設計了獨立於語言和檔案格式的文字分析介面,索引器通過接受Token流完成索引檔案的創立,使用者擴充套件新的語言和檔案格式,只需要實現文字分析的介面。
  • 已經預設實現了一套強大的查詢引擎,使用者無需自己編寫程式碼即可使系統可獲得強大的查詢能力,Lucene的查詢實現中預設實現了布林操作、模糊查詢(Fuzzy Search[11])、分組查詢等等。

本文連結:http://www.codeceo.com/article/lucene-java-search-engine.html
本文作者:碼農網 – 小峰
原創作品,轉載必須在正文中標註並保留原文連結和作者等資訊。]

相關文章