8 個基於 Lucene 的開源搜尋引擎推薦

weixin_34126215發表於2014-04-22

Lucene是一種功能強大且被廣泛使用的搜尋引擎,以下列出了8種基於Lucene的搜尋引擎,你可以想象它們有多麼強大。 


1. Apache Solr 

Solr 是一個高效能,採用Java5開發,基於Lucene的全文搜尋伺服器。文件通過Http利用XML加到一個搜尋集合中。查詢該集合也是通過 http收到一個XML/JSON響應來實現。它的主要特性包括:高效、靈活的快取功能,垂直搜尋功能,高亮顯示搜尋結果,通過索引複製來提高可用性,提 供一套強大Data Schema來定義欄位,型別和設定文字分析,提供基於Web的管理介面等。 

2. Elastic Search 

ElasticSearch是一個基於Lucene構建的開源、分散式、RESTful搜尋引擎。設計用於雲端計算中,能夠達到實時搜尋,穩定、可靠、快速,安裝使用方便。支援通過HTTP使用JSON進行資料索引。 

3. Index Tank 

IndexTank 是一套基於Java的索引-實時全文搜尋引擎實現,其功能如variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest,以及autocomplete等。IndexTank的設計分離了相關性標記和文件內容,因為相關性標記的生命週期和文件本身是不一樣 的,特別是在使用者建立的內容的情況下,例如分享次數,Like按鈕,+1按鈕等。 

4. Katta 

Katta是一個可擴充套件的、故障容錯的、分散式實施訪問的資料儲存。 

Katta可用於大量、重複、索引的碎片,以滿足高負荷和巨大的資料集。這些索引可以是不同的型別。當前該實現在Lucene和Hadoop mapfiles。 

5. Bobo Search 

Bobo-Browse是一個用java寫的lucene擴充套件元件,通過它可以很方便地在lucene上實現分組統計功能。 

比如說搜尋電腦,可以得到CPU是Intel的有幾條命中記錄,CPU是AMD的有幾條命中記錄。 

6. Compass 

Compass是一個強大的、事務的、高效能的物件/搜尋引擎對映(OSEM:object/search engine mapping)與一個Java持久層框架。Compass包括: 

  • 搜尋引擎抽象層(使用Lucene搜尋引薦)。
  • OSEM(Object/Search Engine Mapping)支援。
  • 事務管理。
  • 類似於Google的簡單關鍵字查詢語言。
  • 可擴充套件與模組化的框架。
  • 簡單的API。

7. Summa 

Summa是一種由java開發的、快速模組化和可擴充套件的搜尋引擎。Summa 具有如下特點: 

  • 綜合搜尋:Summa能夠同時訪問許多不同的資料和資料來源,並以一個統一的介面公開。
  • 模組化設計:Summa搜尋系統由一系列獨立模組組成,這使其維護和升級更簡單容易。
  • 可擴充套件性:Summa支援分散式架構而且能夠按比例的擴大或縮小以處理任何數量的資料。
  • 開放標準:Summa基於現代web技術與標準,不包含任何私有程式碼或原理。
  • 故障容錯:如果某單一資料資源或服務出錯,Summa 將會繼續執行而不受出錯部分限制。

8. Constellio 

Constellio 是一個開源的搜尋解決方案,適合企業級的搜尋。基於 Apache Solr 專案構建,使用 Lucene 做為搜尋引擎,並提供基於 Web 的網頁和文件的檢索。可選擇文件型別、資料夾以及檔名進行檢索。

相關文章