#Elasticsearch中文分詞器 #IK分詞器 @FDDLC

凡我出品,皆屬精品發表於2020-11-07

一、標準的英文分詞器對中文的分詞效果

從上圖可知,標準的英文分詞器會把英文拆分成單字。但標準的英文分詞器卻能把英文拆分成單詞:

上面一對比就知道:標準分詞器對中文不夠友好!

 

二、中文分詞器IK的下載安裝

1、IK中文分詞器下載連結:https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.9.3/elasticsearch-analysis-ik-7.9.3.zip

自己選擇版本:https://github.com/medcl/elasticsearch-analysis-ik/releases

2、下載完成後解壓,放到Elasticsearch根目錄下的plugins資料夾下:

3、重啟Elasticsearch,ik分詞器就會被載入。

 

 

三、ik分詞器的簡單使用(使用Kibana、Postman或head)

有關Kibana的介紹,可參考:【不好意思,待續~】

1、ik_smart:單個詞語的長度最長,即得到的詞語數量最少

用Postman或head也行:

 

2、ik_max_word:找出所有可能的詞語,即得到的詞語數量最多

從上圖可知,冰箱、電冰箱均有出現。

 

四、在建立type型別表時指定分詞器,再進行查詢

1、建立索引庫(注意:ES7.x無typ型別表的概念!)

2、往表中新增記錄

逐條新增:

新增完後是這樣的:

 

3、查詢

1)不拆分

 

2)拆分

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

相關文章