Elasticsearch使用系列-ES增刪查改基本操作+ik分詞
一、安裝視覺化工具Kibana
ES是一個NoSql資料庫應用。和其他資料庫一樣,我們為了方便操作檢視它,需要安裝一個視覺化工具 Kibana。
官網:https://www.elastic.co/cn/downloads/kibana
和前面安裝ES一樣,選中對應的環境下載,這裡選擇windows環境,注意安裝的版本一定要和ES的版本一致,不然可能會啟動不起來。
解壓後進到config目錄下修改kibana.yml配置檔案
修改完配置,進入bin目錄,雙擊 kibana.bat 檔案啟動。
啟動後,開啟kibana地址:http://localhost:5601/ ,出現下面介面就是安裝成功了。
點自己瀏覽進入下面
點開發工具進入操作ES的介面,我們ES就在下面介面操作。
二、ES資料結構和資料型別
1.ES資料結構
這裡以Mysql作對比,ES7.0以前的結構是Index,Type,Document,ES7.0以後廢棄了Type,現在ES和Mysql的結構對比如下
MySql | Elasitcsearch |
database(資料庫) | Elasitcsearch(例項) |
table(表) | index(索引) |
row(行) | document(文件) |
column(列) | field(欄位) |
2.ES資料型別
- 字串:text,keyword (重點型別)
- 數值:long,integer,short,byte,double,float,half float,scaled float
- 日期型別:date
- 布林型別:boolean
- 二進位制型別:binary
- 等等。。。
這裡的資料型別標紅的是ES的重點型別,其它的和平時開發的型別一樣,沒什麼特別。
三、ES的增刪查改基本操作
請求方式 | url地址 | 描述 |
PUT | http://localhost:9200/索引名稱 | 建立索引 |
POST | http://local | |
1.建立索引,相當於資料庫建立表
PUT index
PUT user { "mappings" : { "properties" : { "age" : { "type" : "integer" }, "name" : { "type" : "text" }, "name2" : { "type" : "keyword" }, "name3" : { "type" : "text", "fields" : { "keyword" : { "type" : "keyword", "ignore_above" : 256 } } }, "hobby" : { "type" : "text" } } } }
這裡說一下kibana執行的原理,kibana執行的是http請求,前面的PUT為請求方式,還有POST,GET等,後面的user是索引名稱,因為kibana配置了es的資訊,
所以會自動帶上es的地址和埠,實際的請求為 PUT http://192.168.101.13:9200/user
檢視索引欄位資訊
GET index
2.建立文件,相當於資料庫插入資料記錄
POST index/_doc/id (index:索引名稱,_doc:固定,id:指定記錄id,不填會自動生成一個唯一id)
4.查詢
4.1查詢全部
GET index/_search
4.2按條件查詢
GET user/_search { "query": { "term": { "FIELD": { "value": "VALUE" } } } }
5.更新
對應sql語句:update user set age=19 where id=1
_doc,doc,_update:固定寫法
6.刪除
6.1刪除文件(相當於刪除一條資料)
對應sql語句: delete from user where id=1
DELETE user/_doc/1
6.2刪除索引(相當於刪除表)
對應sql語句:drop table user
DELETE user
四、全文索引和ik分詞
1.全文索引
建立索引的時候我上面故意建立了name(text),name1(keyword),name2(text+keyword),然後資料型別也說了text,keyword是ES的重點型別,這裡演示他們的區別。
- keyword型別:查詢時條件只能全匹配
- text型別:全文索引查詢,查詢時會先分詞,然後用分詞去匹配查詢
- keyword+text型別,一個欄位兩種型別,可以全匹配,也可以全文索引查詢
keyword查詢例子,name2(keyword)的查詢:
keyword的查詢用term,或terms(配置多個值)
因為是全匹配,條件”張三“查到資料,條件”張“時查不到資料。
text查詢例子,name(text)的查詢
text的查詢用match
因為是全文索引分詞匹配,所以條件“張三”和條件“張”的,都把匹配到的資料都查詢出來了。
keyword+text查詢例子,name3(text+keyword)的查詢。
當只想查全匹配時,用term查詢
當想用全文索引查詢時,用match
2.ik分詞
1.什麼是分詞?
我搜的是愛祖國,為什麼,“愛釣魚,愛唱歌"的都被搜出來了呢?
因為ES預設內建了一個分詞器standard,看下這個分詞器的分詞結果
可以看到“愛祖國”的分詞結果為“愛,祖,國”,被拆分成了單個字,只要一個字匹配到就查出來,這樣的結果很多不是我們想要的。我們需要一款根據常用詞語的分詞器,這樣查到的結果會更準確,
這裡就用到了ik分詞,ik分詞也是企業開發用的最多的。
2.ik分詞器外掛安裝
官網下載:https://github.com/medcl/elasticsearch-analysis-ik/releases
下載的版本要和es一致。
把檔案下載後,解壓複製到es部署檔案的plugins資料夾下,並把資料夾的名稱改為ik,必須要叫ik。windows,linux,docker(docker為掛載資料夾的方式把檔案對映進去)一樣,
然後重啟es即可生效。
再看一下用ik分詞器的分詞結果。
可以看到,已經是按常用詞語分詞了。
3.自定義片語
上面“愛祖國”,被分成“愛祖國,祖國”,假如我想“愛組”也是一個詞,現在這個詞沒被收怎麼辦?
開啟剛才的ik資料夾下的config目錄
裡面的.dic結尾的都是分詞,開啟其中一個看一下。
所以我們要自定義詞語,可以新建一個myword.dic
裡面寫上想要的分詞
然後在IKAnalyzer.cfg.xml檔案加上剛才的檔名
重啟es,再看一下分詞結果。
4.ik分詞怎麼在索引中使用
建立索引的時候,text型別如果沒指定使用分詞器,就會預設內建的分詞器,所以使用ik分詞器時,建立索引時需要指定。
PUT user2 { "mappings" : { "properties" : { "age" : { "type" : "integer" }, "name" : { "type" : "text" }, "name2" : { "type" : "keyword" }, "name3" : { "type" : "text", "fields" : { "keyword" : { "type" : "keyword", "ignore_above" : 256 } }, "analyzer": "ik_max_word", "search_analyzer": "ik_max_word" }, "hobby" : { "type" : "text", "analyzer": "ik_max_word", "search_analyzer" : "ik_max_word" } } } }
把user的資料複製到user2。
再次查詢“愛祖國”,得到一條想要的資料,沒有多餘資料。證明ik分詞在索引中生效了。