Elasticsearch整合HanLP分詞器
1 、透過 git 下載分詞器程式碼。
連線如下:
hanlp 官網如下:
2 、下載 gradle, 如果本機有,就可以略過此步驟。透過 gradle 官方網站下載,解壓,配置環境即可。
官方安裝配置說明:
3 、按本地 elasticsearch 進行打包。
注意:透過 git 下載的原始碼,除非與 git 配置的版本相同,否則可能會導致你 elasticearch 無法載入分詞器。
修改 git 下載的原始碼包中的 elasticsearch 版本。並透過 gradle 進行打包。會自動下載同步 elasticsearch 對應版本的 jar 包。
圖 1
4 、 按本地環境配置詞類位置
圖 2
5 、 配置打包的外掛所對應支援的 elasticesarch 的版本。 ( 修改為: 5.6.5 , es 安裝的學習環境為 5.6.5)
圖 3
6 、 完成上述配置把。 gradle 自動下載對應版本的包。可以透過如下方式進行版本檢視。
圖 4
7 、確認對應版本的包存在後,在工程所在目錄下執行如下命令進行打包:
gradle -p es-plugin jar buildPluginZip
如下操作:在專案工程目錄下,執行命令。
圖 5
8 、 打包完成後,會出現對應的安裝包。
圖 6
9 、 在 elasticsearch 安裝目錄下執行外掛安裝命令。
./bin/elasticsearch-plugininstallfile:///Users/jiangyu/code/git/hanlp-ext/es-plugin/build/distributions/elasticsearch-hanlp-5.6.5.zip
圖 7
可以看到上面安裝完成的提示。有個過程要選擇 y 。
注:如果上向的命令出現如下報錯。錯誤提示如下 :
圖 8
上述錯誤提示,說明有兩個相同的 jar 包存在。所以有提示,可以先在 build.gradle 配置中,找到打包的過程,增加一條 path.contains("org.apache.logging.log4j") 配置,這樣打包時,這個 jar 包不會在被找到外掛中。配置修改完成後。從新執行第 7 步『 gradle -p es-plugin jar buildPluginZip 』,進重新打包。再重新安裝外掛即可。
圖 9
(注:測試時,這個包不能去掉。會導致測試外掛時,缺少 log4j 包)
10 、 給外掛增加訪問許可權
圖 10
在系統的 elasticsearch 的安裝目錄下,找到 config 目錄,透過 vi jvm.options 開啟檔案進行編輯。增加如下內容:用來指定安全配置檔案。
圖 11
11 、 修改 elasticsearch 配置,在系統的 elasticsearch 的安裝目錄下,找到 bin 目錄,透過 vi elasticearch.in.sh 開啟檔案進行編輯。增加如下內容:用來指定安全配置檔案。
圖 12
12 、 在檔案中增加指定的 lib 包。我們將外掛要用到的 Lib 包路徑引入到系統環境變數中。
圖 13
13 、 安裝完成後可以使用如下命令進行驗證。 analyzer, 指定分詞器為: "hanlp"
GET /_analyze
{
"analyzer" : "hanlp",
"text": [" 記錄就是用來打破的。你準備好向新的記錄發起衝擊了嗎? "]
}
圖 14
圖 15
如果不指定分詞器的話。所以返回結果, type 沒有說明詞性,都是按單字返回結果。
GET /_analyze
{
"text": [" 記錄就是用來打破的。你準備好向新的記錄發起衝擊了嗎? "]
}
圖 16
參考連線如下:
、
其它操作:
如果想移除或刪除外掛,可以執行如下命令
圖 17
轉載自 的部落格
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31524777/viewspace-2215564/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- ElasticSearch-IK分詞器和整合使用Elasticsearch分詞
- HanLP-實詞分詞器詳解HanLP分詞
- Elasticsearch 分詞器Elasticsearch分詞
- #Elasticsearch中文分詞器 #IK分詞器 @FDDLCElasticsearch中文分詞
- Elasticsearch IK分詞器Elasticsearch分詞
- HanLP分類模組的分詞器介紹HanLP分詞
- ElasticSearch之ICU分詞器Elasticsearch分詞
- HanLP分詞工具中的ViterbiSegment分詞流程HanLP分詞Viterbi
- HanLP中文分詞Lucene外掛HanLP中文分詞
- java分詞工具hanlp介紹Java分詞HanLP
- ElasticSearch中使用ik分詞器進行實現分詞操作Elasticsearch分詞
- 分詞工具Hanlp基於感知機的中文分詞框架HanLP中文分詞框架
- Ansj與hanlp分詞工具對比HanLP分詞
- Hanlp分詞之CRF中文詞法分析詳解HanLP分詞CRF詞法分析
- elasticsearch教程--中文分詞器作用和使用Elasticsearch中文分詞
- Elasticsearch(ES)分詞器的那些事兒Elasticsearch分詞
- elasticsearch安裝和使用ik分詞器Elasticsearch分詞
- HanLP Analysis for ElasticsearchHanLPElasticsearch
- elasticsearch之ik分詞器和自定義詞庫實現Elasticsearch分詞
- 基於hanlp的es分詞外掛HanLP分詞
- HanLP分詞命名實體提取詳解HanLP分詞
- python呼叫hanlp分詞包手記PythonHanLP分詞
- Spark中分散式使用HanLP(1.7.0)分詞示例Spark分散式HanLP分詞
- 基於 HanLP 的 ES 中文分詞外掛HanLP中文分詞
- Hanlp中使用純JAVA實現CRF分詞HanLPJavaCRF分詞
- Elasticsearch從入門到放棄:分詞器初印象Elasticsearch分詞
- Elasticsearch學習系列一(部署和配置IK分詞器)Elasticsearch分詞
- ElasticSearch7.3 學習之定製分詞器(Analyzer)Elasticsearch分詞
- 中文分詞演算法工具hanlp原始碼解析中文分詞演算法HanLP原始碼
- Spring MVCD框架中呼叫HanLP分詞的方法SpringMVC框架HanLP分詞
- Hanlp在java中文分詞中的使用介紹HanLPJava中文分詞
- HanLP程式碼與詞典分離方案與流程HanLP
- ElasticSearch5.6.1 + 中文分詞(IK)ElasticsearchH5中文分詞
- ElasticSearch7.3學習(十五)----中文分詞器(IK Analyzer)及自定義詞庫Elasticsearch中文分詞
- ElasticSearch安裝ik分詞外掛Elasticsearch分詞
- ElasticSearch(三) ElasticSearch中文分詞外掛IK的安裝Elasticsearch中文分詞
- 自己動手製作elasticsearch的ik分詞器的Docker映象Elasticsearch分詞Docker
- ElasticSearch7.6.2在windows上如何配置ik分詞器與用法ElasticsearchWindows分詞