分享一個免費的 Lucene中文分片語件V1.2.2

atlantis發表於2006-06-14
1.2.2
完善了中英文噪聲詞典

1.2.1
修正中文數字成語無法識別的問題

1.2
增加中文數字的匹配(如:二零零六)
數量詞采用“n”作為數字萬用字元
最佳化詞典結構以便修改調整

1.1
增加擴充套件詞典的靜態讀取方法

1.0.1
修正無法識別生僻字的問題

1.0
支援英文、數字、中文(簡體)混合分詞
常用的數量和人名的匹配
超過22萬詞的詞庫整理
實現正向最大匹配演算法

下載地址:http://www.jesoft.cn/posts/list/5.page

相關文章