day88-ElasticSearch-分詞- 自定義擴充套件詞庫
1.為了nginx容器配置,執行如下程式碼,若沒有nginx容器會從遠端拉取
docker run -p 80:80 --name nginx \
-v /mydata/nginx/html:/usr/share/nginx/html \
-v /mydata/nginx/logs:/var/log/nginx \
-v /mydata/nginx/conf/:/etc//nginx \
-d nginx:1.10 POST _analyze
2.如下記憶體不太夠,調大點
virtualbox上調整下
3.訪問http://192.168.56.10/出現如下說明nginx配置遷移成功
4.在nginx的html資料夾下新增index.html並新增 <h1>gulimall</h1> 再次訪問會出現如下
5.新增自定義分詞檔案
[root@localhost html]# mkdir es
[root@localhost html]# ls
es index.html
[root@localhost html]# cd es
[root@localhost es]# ls
[root@localhost es]# vi fenci.txt
尚矽谷
喬碧蘿
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
我在輸入中文的時候亂碼了,所以在CRT中先調整了編碼格式
6.修改配置上面自定義配置生效
[root@localhost elasticsearch]# ls
config data plugins
[root@localhost elasticsearch]# cd plugins/
[root@localhost plugins]# ls
ik
[root@localhost plugins]# cd ik
[root@localhost ik]# ls
commons-codec-1.9.jar config httpclient-4.5.2.jar plugin-descriptor.properties
commons-logging-1.2.jar elasticsearch-analysis-ik-7.4.2.jar httpcore-4.4.4.jar plugin-security.policy
[root@localhost ik]# cd config/
[root@localhost config]# ls
extra_main.dic extra_single_word_full.dic extra_stopword.dic main.dic quantifier.dic suffix.dic
extra_single_word.dic extra_single_word_low_freq.dic IKAnalyzer.cfg.xml preposition.dic stopword.dic surname.dic
[root@localhost config]# vi IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 擴充套件配置</comment>
<!--使用者可以在這裡配置自己的擴充套件字典 -->
<entry key="ext_dict"></entry>
<!--使用者可以在這裡配置自己的擴充套件停止詞字典-->
<entry key="ext_stopwords"></entry>
<!--使用者可以在這裡配置遠端擴充套件字典 -->
<entry key="remote_ext_dict">http://192.168.56.10/es/fenci.txt</entry>
<!--使用者可以在這裡配置遠端擴充套件停止詞字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
~
~
~
7.重啟es並設定自啟動
[root@localhost config]# cd /
[root@localhost /]# docker start elasticsearch
elasticsearch
[root@localhost /]# docker update elasticsearch --restart=always
8.測試,發現我們新新增的倆詞彙:喬碧蘿,尚矽谷生效了,成功分詞
相關文章
- 使用cjieba(結巴分詞庫)實現php擴充套件中文分詞JiebaPHP套件中文分詞
- 使用Docker快速安裝部署ES和Kibana並配置IK中文分詞器以及自定義分詞擴充詞庫Docker中文分詞
- 中文分詞 PHP 擴充套件 SCWS 安裝中文分詞PHP套件
- elasticsearch之ik分詞器和自定義詞庫實現Elasticsearch分詞
- 使用cjieba(結巴分詞庫)實現php擴充套件中文分詞-支援php5, php7JiebaPHP套件中文分詞
- 安裝PHPscws分詞擴充套件時候遇到的坑PHP分詞套件
- es 自定義分詞外掛分詞
- ElasticSearch7.3學習(十五)----中文分詞器(IK Analyzer)及自定義詞庫Elasticsearch中文分詞
- HIVE自定義函式的擴充套件Hive函式套件
- Android自定義字型--自定義TextView(可擴充套件不同ttf字Android自定義字型TextView套件
- 回覆關鍵詞的無限擴充套件機制套件
- [外掛擴充套件]百度關鍵詞排名套件
- JMeter擴充套件開發:自定義函式JMeter套件函式
- JMeter 擴充套件開發:自定義 Java SamplerJMeter套件Java
- Elasticsearch 近義詞詞庫配置Elasticsearch
- [外掛擴充套件]onethink自定義分類標籤-關聯模型套件模型
- django實現自定義manage命令的擴充套件Django套件
- .Net Core AutoMapper自定義擴充套件方法的使用APP套件
- Kibana的Dev Tools中建立自定義分詞器dev分詞
- 基於shiro的自定義註解的擴充套件套件
- 程式碼演示Mybatis-Generator 擴充套件自定義生成MyBatis套件
- DcatAdmin 擴充套件: 自定義表單(動態表單)套件
- tep0.9.5支援自定義擴充套件request套件
- 分類擴充套件套件
- hibernate跨資料庫,json欄位處理方案,自定義擴充套件JsonStringType資料庫JSON套件
- MapReduce實現與自定義詞典檔案基於hanLP的中文分詞詳解HanLP中文分詞
- form-create-designer中怎麼擴充套件自定義元件ORM套件元件
- Laravel-admin 自定義擴充套件,jQuery 語法錯誤?Laravel套件jQuery
- node-exporter 擴充套件用法 – shell 自定義 exporter 監控Export套件
- elasticsearch之使用正規表示式自定義分詞邏輯Elasticsearch分詞
- 中文分詞原理及常用Python中文分詞庫介紹中文分詞Python
- pyhanlp 停用詞與使用者自定義詞典功能詳解HanLP
- Laravel 框架擴充套件 Auth 認證,實現自定義 driver,guardLaravel框架套件
- jquery 擴充套件方法($.fn.extend/$.extend) 自定義外掛 拖拽jQuery套件
- 實戰 | 執行緒池的幾種自定義擴充套件執行緒套件
- AbpVnext使用分散式IDistributedCache Redis快取(自定義擴充套件方法)分散式Redis快取套件
- JMeter 擴充套件開發:自定義 JMeter 外掛的除錯JMeter套件除錯
- ASP.NET Core擴充套件庫之Http通用擴充套件ASP.NET套件HTTP