Elasticsearch學習系列二（基礎操作）

女友在高考發表於2022-06-19

原文網址 : https://www.cnblogs.com/javammc/p/16390582.html

本文將分為3塊講解Es的基礎操作。分別為：索引(index)、對映(mapping)、文件(document)。

索引操作

建立索引庫

語法：

PUT /索引名稱{
  "settings":{
    "屬性名":"屬性值"
  }
}

settings：就是索引庫的設定，可以定義如分片數、副本數等等。不設定的話就是都走預設值。

示例：

PUT /test-demo

判斷索引是否存在

HEAD /索引名稱

檢視索引

檢視單個索引

GET /索引名稱

批量檢視索引

GET /索引名稱1,索引名稱2

檢視所有索引

GET _all

開啟索引

POST /索引名稱/_open

關閉索引

POST /索引名稱/_close

刪除索引

DELETE /索引名稱

對映操作

索引建立之後，等於有了關係型資料庫中的database。Es7.x取消了索引type型別的設定，不能指定型別，預設為_doc，但是欄位仍然是有的，我們需要設定欄位的約束資訊，叫做欄位對映(mapping)。

欄位的約束包括：

欄位的資料型別
是否要儲存
是否要索引
分詞器等

建立對映欄位

語法：

PUT /索引名/_mapping
{
  "properties":{
    "欄位名":{
      "type":"型別",
      "index":true,
      "store":true,
      "analyzer":"分詞器"
    }
  }
}

欄位名：根據需要任意填寫
type：型別，可以是text（可分詞）、keyword（不可分詞）、long、short、date、integer、object
index：是否索引，預設為true
store：是否獨立儲存，預設為false。原始的文字會儲存在 _source 裡面，如果設定為true，則是獨立的儲存某個欄位，獲取獨立儲存欄位比從_source裡解析快，但是更佔空間。
analyzer：指定分詞器，一般中文可以選擇ik_max_word、ik_smart

示例：

PUT /test-demo1/_mapping
{
  "properties":{
    "name":{
      "type":"text",
      "index":true,
      "store":true,
      "analyzer":"ik_max_word"
    },
    "job":{
      "type":"text",
      "analyzer":"ik_max_word"
    },
    "logo":{
      "type":"keyword",
      "index":false
    }
    ,
    "amt":{
      "type":"double"
    }
  }
}

檢視對映關係

檢視某個索引

GET /索引名稱/_mapping

檢視所有索引

GET _mapping
#或者
GET _all/_mapping

修改對映關係

這裡的修改指的是新增欄位，其他更改不支援。只能刪除索引，重建對映

PUT /索引庫名/_mapping
{
 "properties": {
  "欄位名": {
   "type": "型別",
   "index": true，
   "store": true，
   "analyzer": "分詞器"
 }
}
}

一次性建立索引和對映

語法：

put /索引庫名稱
{
  "settings":{
    "索引庫屬性名":"索引庫屬性值"
},
  "mappings":{
    "properties":{
        "欄位名":{
        "對映屬性名":"對映屬性值"
      }
    }
  }
}

示例：

PUT /test-demo2
{
  "settings":{},
  "mappings": {
    "properties": {
      "name":{
        "type":"text",
        "analyzer": "ik_max_word"
      }
    }
  }
}

文件操作

文件，即索引庫中的資料，會根據規則建立索引，將來用於搜尋。可以類比做資料庫中的一行資料。

新增文件

語法：

#自動生成id
POST /索引名稱/_doc
{
"field":"value"
}

#手動指定id
POST /索引名稱/_doc/1
{
"field":"value"
}

示例：

POST /test-demo1/_doc/1
{
  "name":"百度",
  "job":"運營",
  "amt":"3000.34",
  "logo":"http://www.lgstatic.com/ttasdf2",
  "createTime":"20220303230000"
  
}

檢視單個文件

GET /索引名稱/_doc/{id}

結果如下：

{
  "_index" : "test-demo1",
  "_type" : "_doc",
  "_id" : "1",
  "_version" : 1,
  "_seq_no" : 0,
  "_primary_term" : 2,
  "found" : true,
  "_source" : {
    "name" : "百度",
    "job" : "運營",
    "amt" : "3000.34",
    "logo" : "http://www.lgstatic.com/ttasdf2",
    "createTime" : "20220303230000"
  }
}

後設資料項	含義
_index	document所屬index
_type	document所屬type，Elasticsearch7.x預設type為_doc
_id	代表document的唯一標識，與index和type一起，可以唯一標識和定位一個document
_version	document的版本號，Elasticsearch利用_version(版本號)的方式來確保應用中相互衝突的變更不會導致資料丟失。需要修改資料時，需要指定想要修改文件的version號，如果該版本不是當前版本號，請求將會失敗
_seq_no	嚴格遞增的順序號，每個文件一個，Shard級別嚴格遞增，保證後寫入的Doc seq_no大於先寫入的Doc的seq_no。任何型別的寫操作，包括index、create、update和Delete，都會生成一個_seq_no。
_primary_term	當Primary Shard發生重新分配時，比如重啟，Primary選舉等，_primary_term會遞增1。_primary_term主要是用來恢復資料時處理當多個文件的_seq_no一樣時的衝突，避免Primary Shard上的寫入被覆蓋
found	true/false，是否查詢到文件
_source	儲存原始文件

檢視所有文件

POST /test-demo1/_search
{
  "query":{
    "match_all": {}
  }
}

僅查詢部分欄位

GET /test-demo1/_doc/1?_source=name,job

更新文件（全部更新）

PUT /test-demo1/_doc/1
{
  "name":"百度3",
  "job":"運營",
  "amt":"3000.34",
  "logo":"http://www.lgstatic.com/ttasdf2",
  "createTime":"20220303230000"
  
}

為什麼說是全部更新呢？如果你只傳了name，其他filed不傳。那麼文件裡就只剩name了。

注意：Elasticsearch執行更新操作的時候，Elasticsearch首先將舊的文件標記為刪除狀態，然後新增新的文件，舊的文件不會立即消失，但是你也無法訪問，Elasticsearch會在你繼續新增更多資料的時候在後臺清理已經標記為刪除狀態的文件。

全部更新，是直接把之前的老資料，標記為刪除狀態，然後，再新增一條更新的（使用PUT或者POST）

更新文件（部分更新）

POST /索引名稱/_update/{id}
{
  "doc":{
    "field":"value"
  }
}

刪除文件

根據id刪除

DELETE /索引名稱/_doc/{id}

根據查詢條件刪除

POST /索引名稱/_delete_by_query
{
  "query":{
    "match":{
      "欄位名":"搜尋關鍵字"
    }
  }
}

刪除所有文件

POST /索引名稱/_delete_by_query
{
  "query":{
    "match_all":{}
  }
}

文件強制建立

本來如果不存在會建立，存在會更新。強制建立就是僅建立，不更新。已存在就報錯。

PUT /索引名稱/_doc/{id}?op_type=create
{
  "filed":"value"
}

elasticsearch 基礎操作
2020-04-04
Elasticsearch
【Elasticsearch學習】之基礎概念
2020-05-03
Elasticsearch
TensorFlow系列專題（二）：機器學習基礎
2018-11-05
機器學習
Linux基礎學習系列——Linux檔案目錄操作命令
2021-09-09
Linux
Java基礎系列-二進位制操作
2019-02-22
Java
postgreSQL學習（二）:pgsql的一些基礎操作
2018-10-25
SQL
Spark學習（二）——RDD基礎
2019-03-31
Spark
二、MySQL基礎操作
2024-07-05
MySql
分散式搜尋引擎Elasticsearch基礎入門學習
2023-05-10
分散式Elasticsearch
基於PaddlePaddle的詞向量實戰 | 深度學習基礎任務教程系列（二）
2019-04-22
深度學習
Pytorch系列之常用基礎操作
2020-12-12
PyTorch
Linux入門學習（1基礎操作命令）
2018-08-06
Linux
01-Excel基礎操作-學習筆記
2024-05-09
Excel筆記
05-Excel基礎操作-學習筆記
2024-06-04
Excel筆記
04-Excel基礎操作-學習筆記
2024-05-29
Excel筆記
Kali Linux基礎操作學習篇——mkdir命令
2020-12-01
Linux
DelayQueue系列（二）：基礎元件
2018-12-24
元件
Elasticsearch聚合學習之一：基本操作
2022-09-13
Elasticsearch
Elasticsearch 學習二（請求流程）.
2020-12-21
Elasticsearch
OpenGL 學習系列--基礎的繪製流程
2018-05-08
Java 基礎學習系列一 —— Java 主要特性
2020-05-04
Java
Go基礎系列：1. 學習前導
2021-09-10
Go
ElasticSearch基礎
2018-04-23
Elasticsearch
零基礎學習Alfred(一)：入門操作
2020-10-13
Alfred
C++中string字串的基礎操作，學習
2024-11-10
C++字串
Zookeeper系列一：Zookeeper基礎命令操作
2018-06-03
學習筆記【MySQL基礎操作-第一節：MySQL基本操作】
2020-12-24
筆記MySql
Spring boot學習（二） Spring boot基礎配置
2019-01-17
Spring Boot
大資料學習之路——java基礎（二）
2019-04-01
大資料Java
Mysql基礎學習第二天
2022-03-05
MySql
redis基礎系列二：淘汰策略
2021-08-30
Redis
零基礎學習人工智慧—Python—Pytorch學習（二）
2024-08-08
人工智慧PythonPyTorch
TensorFlow系列專題（一）：機器學習基礎
2018-11-05
機器學習
elasticsearch(二)---基本資料操作
2018-08-19
Elasticsearch
Service Cloud零基礎學習(二)Entitlement & MileStone
2020-11-23
Cloud
Elasticsearch聚合學習之二：區間聚合
2022-09-14
Elasticsearch
Flutter學習總結系列----Flutter基礎全面詳解
2018-07-04
Flutter
深入學習二叉樹 (一) 二叉樹基礎
2019-06-13
二叉樹

Elasticsearch學習系列二（基礎操作）

索引操作

對映操作

文件操作

相關文章