Apache Lucene 4釋出
Apache Lucene是一個高效能,全功能的文字搜尋引擎庫,完全用Java編寫的。這是一個技術適用於幾乎
任何需要全文搜尋,特別是跨平臺的應用程式。
Apache Lucene 4.0版的亮點:
1. 索引格式支援條目、郵件列表、資料庫儲存的欄位、條目向量等格式,通過編碼器API實現了可插拔。可以選擇或自定義索引格式。
2. 向量空間模型的相似度解耦(TF-IDF)。有附加模型(如BM25)、隨機偏離、語言模型、基於資訊的模型等。
3. IndexWriter支援並行寫磁碟,適用於應用程式使用多執行緒建立索引的場景。
4. 每個文件的歸一化因此不再侷限於單個位元組。
5. 增加了新的索引統計,包括條目或欄位的令牌數等。
6. 新的預設字典索引(BlockTree)。
7. 索引的條目不再受UTF-16字元的限制。預設情況下,文字條目使用UTF-8編碼。
8. 在搜尋期間使用過濾器能獲得更好的效能。
9. 替換了大量的編碼器和元件。
10. 條目偏移量是可選的,被編碼到郵件列表並可按位置檢索。
11. 新的自動查詢,返回所有文件包含的條目,條目由有限狀態機自動提供。
12. 模糊查詢的效能比上一版提高了100~200倍。
13. 新的拼寫檢查器。
14. 提供了各種記憶體資料結構,比如字典條目和欄位快取等。
任何需要全文搜尋,特別是跨平臺的應用程式。
Apache Lucene 4.0版的亮點:
1. 索引格式支援條目、郵件列表、資料庫儲存的欄位、條目向量等格式,通過編碼器API實現了可插拔。可以選擇或自定義索引格式。
2. 向量空間模型的相似度解耦(TF-IDF)。有附加模型(如BM25)、隨機偏離、語言模型、基於資訊的模型等。
3. IndexWriter支援並行寫磁碟,適用於應用程式使用多執行緒建立索引的場景。
4. 每個文件的歸一化因此不再侷限於單個位元組。
5. 增加了新的索引統計,包括條目或欄位的令牌數等。
6. 新的預設字典索引(BlockTree)。
7. 索引的條目不再受UTF-16字元的限制。預設情況下,文字條目使用UTF-8編碼。
8. 在搜尋期間使用過濾器能獲得更好的效能。
9. 替換了大量的編碼器和元件。
10. 條目偏移量是可選的,被編碼到郵件列表並可按位置檢索。
11. 新的自動查詢,返回所有文件包含的條目,條目由有限狀態機自動提供。
12. 模糊查詢的效能比上一版提高了100~200倍。
13. 新的拼寫檢查器。
14. 提供了各種記憶體資料結構,比如字典條目和欄位快取等。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/301743/viewspace-746369/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Apache Airflow 2.3.0 釋出ApacheAI
- Apache APISIX 2.13.0 釋出ApacheAPI
- Apache Kafka 3.0.0釋出ApacheKafka
- Apache Flink 1.16 正式釋出Apache
- Apache Tomcat 8.5.40 與 7.0.94 釋出ApacheTomcat
- Apache Doris 2.0.5 版本正式釋出Apache
- Apache Doris 2.0.5 版本正式釋出!Apache
- Apache Doris 2.0.4 版本正式釋出Apache
- Apache Doris 2.0.3 版本正式釋出Apache
- Apache Flink ML 2.2.0 釋出公告Apache
- Apache DolphinScheduler 3.2.2 版本正式釋出!Apache
- Apache APISIX Ingress 1.6 正式釋出!ApacheAPI
- 重磅!Apache Kafka 3.3 正式釋出!ApacheKafka
- Apache APISIX 3.1.0 版本正式釋出ApacheAPI
- Apache Flink ML 2.1.0 釋出公告Apache
- Apache Doris 3.0.3 版本正式釋出Apache
- Apache HugeGraph1.0.0 版本正式釋出!Apache
- 官宣|Apache Flink 1.17 釋出公告Apache
- 官宣|Apache Flink 1.16 釋出公告Apache
- Apache Doris 1.2.2 Release 版本正式釋出Apache
- 官宣|Apache Flink 1.15 釋出公告Apache
- Apache Hudi 0.6.0版本重磅釋出Apache
- Apache SeaTunnel 2.3.8版本正式釋出!Apache
- 基於Hadoop的Apache Hudi 0.10 釋出HadoopApache
- 重磅|Apache ShardingSphere 5.0.0 即將正式釋出Apache
- Apache Hudi 0.13.0版本重磅釋出!Apache
- Apache Hudi 0.8.0版本重磅釋出Apache
- Apache Log4j 被曝第 3 個漏洞:不受控遞迴 | Apache 官方已釋出 2.17 版本修復Apache遞迴
- Apache Spark 3.0 預覽版正式釋出,多項重大功能釋出ApacheSpark
- 高危預警 || 海雲安釋出Apache Log4j2漏洞處置方案Apache
- 如何完成一次Apache的版本釋出Apache
- Apache Doris 1.2.4 Release 版本正式釋出|版本通告Apache
- 專案動態|Apache Pulsar 2.7.4 版本釋出Apache
- Apache HBase 1.7.1 釋出,分散式資料庫Apache分散式資料庫
- 當Atlas遇見Flink——Apache Atlas 2.2.0釋出!Apache
- Bootstrap4 正式釋出boot
- PrimTux 釋出第 4 版UX
- .NET Aspire Preview 4 釋出!View
- Apache Doris(incubating) 成功釋出第一個版本0.9.0ApacheBAT