ELK批量刪除索引及叢集相關操作記錄

散盡浮華發表於2018-11-21

原文網址 : https://www.cnblogs.com/kevingrace/p/9994178.html

線上部署了ELK+Redis日誌分析平臺環境, 隨著各類日誌資料來源源不斷的收集, 發現過了一段時間之後, ELK檢視會原來越慢, 重啟elasticsearch伺服器節點之前同步時間也會很長, 這是因為長期以來ELK收集的索引沒有刪除引起的! 以下是ELK批量刪除索引的操作記錄:

1) 訪問head外掛(http://10.0.8.44:9200/_plugin/head/) 或者在elasticsearch節點上使用下面命令檢視elk的索引(10.0.8.44是elk叢集中的任意一個節點)

[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cat/shards'               

刪除索引的命令
[root@elk-node01 ~]# curl -XDELETE  http://10.0.8.44:9200/索引名

還可以根據需求,過濾出想要檢視的索引,比如檢視2018.08.02並且是10.0.52.22的索引
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cat/shards'  |grep "2018\.08\.02" |grep "10.0.52.22"|awk '{print $1}'

2) 可以先將要刪除的索引檢視出來存到臨時檔案裡, 然後進行批量刪除

比如批量刪除所有的索引(但不會刪除kibana.yml檔案中配置的kibana.index索引,就是那些帶.的索引)
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cat/shards'|awk '{print $1}'|uniq > /root/elk-index.tmp
[root@elk-node01 ~]# for i in $(cat /root/elk-index.tmp);do curl -XDELETE  http://10.0.8.44:9200/$i;done

3) 為了方便可以在計劃任務裡面加定時任務刪除30天之前的日誌索引 (這裡線上elk的索引名中帶當天的日期, 日期格式為%Y.%m.%d. 具體看自己的索引命名規則)

[root@elk-node01 ~]# vim /home/scripts/del_elasticseatch_index.sh
#!/bin/bash
#The index 30 days ago
curl -XGET 'http://10.0.8.44:9200/_cat/shards' |awk '{print $1}' |grep `date -d "30 days ago" +%Y.%m.%d` |uniq > /tmp/index_name.tmp

for index_name in `cat /tmp/index_name.tmp`  
do
    curl -XDELETE  http://10.0.8.44:9200/$index_name
    echo "${index_name} delete success" >> /home/scripts/del_elasticseatch_index.log
done

[root@elk-node01 ~]# crontab -l
0 3 * * * bash /home/scripts/del_elasticseatch_index.sh

上述指令碼執行之後, 訪問http://10.0.8.44:9200/_plugin/head/ ,就會發現,ELK索引已被批量刪除了.

====================================ES叢集節點切換=======================================

在ELK叢集中任意節點上檢視叢集狀態(10.0.8.44是任意一個節點地址).
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cat/health?v'
epoch      timestamp cluster  status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542781206 14:20:06  kevin-elk green           3         3      6   3    0    0        0             0                  -                100.0%
 
ELK叢集健康檢查的三種狀態:
green： 每個索引的primary shard和replica shard都是active狀態的
yellow：每個索引的primary shard都是active狀態的，但是部分replica shard不是active狀態，處於不可用的狀態
red：   不是所有索引的primary shard都是active狀態的，部分索引有資料丟失了
 
其中 yellow 表示所有主分片可用，但不是所有副本分片都可用，最常見的情景是單節點時，由於es預設是有1個副本，主分片和副本不能在同一個節點上，所以副本就是未分配unassigned
 
分配分片時可能遇到的坑，需要注意的地方:
1) 分配副本時必須要帶引數"allow_primary" : true, 不然會報錯
2) 當叢集中es版本不同時，如果這個未分配的分片是高版本生成的，不能分配到低版本節點上，反過來低版本的分片可以分配給高版本，如果遇到了，只要升級低版本節點的ES版本即可
 
*符號表示該節點為當前主節點.
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cat/nodes?v'
host      ip        heap.percent ram.percent load node.role master name                       
10.0.8.44 10.0.8.44           53          22 0.03 d         m      elk-node01.kevinbo.cn
10.0.8.47 10.0.8.47           39          54 0.03 d         m      elk-node03.kevinbo.cn
10.0.8.45 10.0.8.45           42          20 0.00 d         *      elk-node02.kevinbo.cn
 
如果當上面的主節點(10.0.8.45)出現故障,比如當機,es服務掛掉或重啟, 則主節點會轉移到其他的兩個從節點中的一個上面.
在主節點轉移過程中, 分片也會轉移過去, 如果分片比較多, 資料量比較大, 則需要耗費一定的時間, 在此過程中, elk叢集的狀態是yellow.
具體表現:
[root@elk-node01 plugins]#  curl -XGET 'http://10.0.8.44:9200/_cat/health?v'
epoch      timestamp cluster  status node.total node.data shards  pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542769559 11:05:59  kevin-elk yellow          3         3   2560 1898    0    4     1232             8            829.4ms                 67.4%
 
[root@elk-node01 plugins]#  curl -XGET 'http://10.0.8.44:9200/_cat/health?v'
epoch      timestamp cluster  status node.total node.data shards  pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542769632 11:07:12  kevin-elk yellow          3         3   3074 1898    0    4      718             0                  -                 81.0%
 
[root@elk-node01 plugins]#  curl -XGET 'http://10.0.8.44:9200/_cat/health?v'
epoch      timestamp cluster  status node.total node.data shards  pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542769637 11:07:17  kevin-elk yellow          3         3   3111 1898    0    4      681             4              221ms                 82.0%
 
...............
...............
...............
[root@elk-node01 plugins]#  curl -XGET 'http://10.0.8.44:9200/_cat/health?v'
epoch      timestamp cluster  status node.total node.data shards  pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542769761 11:09:21  kevin-elk green           3         3   3796 1898    0    0        0             0                  -                100.0%
 
如上會發現, 在主節點發生變動, 分片轉移過程中, 檢視elk叢集狀態, shards分片會不斷增加, unassign會不斷減少,直至unassign減到0時, 表明分片已經完全轉移到新的
主節點上, 則此時檢視elk的健康狀態就是green了.  
 
在分片轉移過程中, 訪問http://10.0.8.44:9200/_plugin/head/ 外掛介面, 也會看到yellow狀態值,並且後面的分片數會不斷增加中.

====================================ES叢集相關維護命令====================================

1) 查詢elasticsearch叢集資訊（下面命令在任意一個節點機器上操作都可以）
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cat/nodes'   
10.0.8.44 10.0.8.44 54 22 0.00 d m elk-node01.kevinbo.cn
10.0.8.47 10.0.8.47 38 54 0.00 d m elk-node03.kevinbo.cn
10.0.8.45 10.0.8.45 39 20 0.00 d * elk-node02.kevinbo.cn
  
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cat/nodes?v'
host      ip        heap.percent ram.percent load node.role master name                      
10.0.8.44 10.0.8.44           54          22 0.00 d         m      elk-node01.kevinbo.cn
10.0.8.47 10.0.8.47           38          54 0.00 d         m      elk-node03.kevinbo.cn
10.0.8.45 10.0.8.45           39          20 0.00 d         *       elk-node02.kevinbo.cn
  
2) 查詢叢集中的master
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cluster/state/master_node?pretty'   
{
  "cluster_name" : "kevin-elk",
  "master_node" : "1dL42NBYSL6mG9pg_ZUg-Q"
}
  
或者
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cat/master?v'    
id                                            host         ip            node                      
1dL42NBYSL6mG9pg_ZUg-Q 10.0.8.45 10.0.8.45 elk-node02.kevinbo.cn
  
3) 查詢叢集狀態方法
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.45:9200/_cluster/state/nodes?pretty'   
{
  "cluster_name" : "kevin-elk",
  "nodes" : {
    "3Nw9dTQ5Qkmb-HW18kojeA" : {
      "name" : "elk-node01.kevinbo.cn",
      "transport_address" : "10.0.8.44:9300",
      "attributes" : { }
    },
    "wKrnuaSaQYic_r4jKIzPWQ" : {
      "name" : "elk-node03.kevinbo.cn",
      "transport_address" : "10.0.8.47:9300",
      "attributes" : { }
    },
    "1dL42NBYSL6mG9pg_ZUg-Q" : {
      "name" : "elk-node02.kevinbo.cn",
      "transport_address" : "10.0.8.45:9300",
      "attributes" : { }
    }
  }
}
  
4) 查詢叢集的健康狀態
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cat/health?v'   
epoch      timestamp cluster  status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1542784475 15:14:35  kevin-elk green           3         3      6   3    0    0        0             0                  -                100.0%
  
或者
[root@elk-node01 ~]# curl -XGET 'http://10.0.8.44:9200/_cluster/health?pretty'   
{
  "cluster_name" : "kevin-elk",
  "status" : "green",
  "timed_out" : false,
  "number_of_nodes" : 3,
  "number_of_data_nodes" : 3,
  "active_primary_shards" : 3,
  "active_shards" : 6,
  "relocating_shards" : 0,
  "initializing_shards" : 0,
  "unassigned_shards" : 0,
  "delayed_unassigned_shards" : 0,
  "number_of_pending_tasks" : 0,
  "number_of_in_flight_fetch" : 0,
  "task_max_waiting_in_queue_millis" : 0,
  "active_shards_percent_as_number" : 100.0
}
  
5) 查詢叢集索引
[root@elk-node01 ~]# curl -XGET   "http://10.0.8.44:9200/_cat/shards"   
.cx-kibana  0 r STARTED 1 3.1kb 10.0.8.44 elk-node01.kevinbo.cn
.cx-kibana  0 p STARTED 1 3.1kb 10.0.8.45 elk-node02.kevinbo.cn
.ops-kibana 0 p STARTED 1 3.1kb 10.0.8.47 elk-node03.kevinbo.cn
.ops-kibana 0 r STARTED 1 3.1kb 10.0.8.45 elk-node02.kevinbo.cn
.nc-kibana  0 p STARTED 1 3.1kb 10.0.8.44 elk-node01.kevinbo.cn
.nc-kibana  0 r STARTED 1 3.1kb 10.0.8.47 elk-node03.kevinbo.cn
  
6) 查詢叢集索引狀態
[root@elk-node01 ~]# curl -XGET   "http://10.0.8.44:9200/_cat/indices?v"
health status index       pri rep docs.count docs.deleted store.size pri.store.size
green  open   .nc-kibana    1   1          1            0      6.3kb          3.1kb
green  open   .cx-kibana    1   1          1            0      6.3kb          3.1kb
green  open   .ops-kibana   1   1          1            0      6.3kb          3.1kb
  
7) 關閉或開啟某個索引
比如關閉.ops-kibana索引
[root@elk-node01 ~]# curl -XPOST "http://10.0.8.44:9200/.ops-kibana/_close"
{"acknowledged":true}
  
[root@elk-node01 ~]# curl -XGET   "http://10.0.8.44:9200/_cat/indices?v" 
health status index       pri rep docs.count docs.deleted store.size pri.store.size
green  open   .nc-kibana    1   1          1            0      6.3kb          3.1kb
green  open   .cx-kibana    1   1          1            0      6.3kb          3.1kb
       close  .ops-kibana   
  
再次開啟.ops-kibana索引
  
[root@elk-node01 ~]# curl -XPOST "http://10.0.8.44:9200/.ops-kibana/_open"
{"acknowledged":true}
  
[root@elk-node01 ~]# curl -XGET   "http://10.0.8.44:9200/_cat/indices?v"
health status index       pri rep docs.count docs.deleted store.size pri.store.size
green  open   .nc-kibana    1   1          1            0      6.3kb          3.1kb
green  open   .cx-kibana    1   1          1            0      6.3kb          3.1kb
green  open   .ops-kibana   1   1          1            0      6.3kb          3.1kb
  
8) 刪除索引
# curl -XDELETE  http://10.0.8.44:9200/索引名

GBase XDM（單機/分片叢集）資料庫刪除記錄
2021-09-08
資料庫
HAC叢集部署vip及相關操作
2022-04-13
vue+element-ui操作刪除（單行和批量刪除）
2018-08-15
VueUI
搭建ELK叢集
2018-11-15
git相關操作，個人記錄
2024-10-16
Git
Docker搭建ELK叢集
2021-06-29
Docker
刪除k8s叢集
2024-09-19
K8S
Haproxy+Heartbeat 高可用叢集方案操作記錄
2019-01-02
LVS+Heartbeat 高可用叢集方案操作記錄
2018-12-24
線性表的相關操作-初始化、增添、刪除
2020-09-29
Oracle叢集軟體管理-新增和刪除叢集節點
2020-03-19
Oracle
06 . ELK Stack + kafka叢集
2020-07-24
Kafka
Jedis操作單節點redis，叢集及redisTemplate操作redis叢集（一）
2018-06-13
Redis
Docker批量操作（啟停、刪除、歸檔、載入）
2020-08-27
Docker
mysql刪除主鍵索引，刪除索引語法
2024-05-22
MySql索引
php(js)批量刪除/單個刪除
2020-09-30
PHPJS
win10更新失敗記錄怎麼刪除_win10更新失敗記錄刪除操作方法
2020-07-01
Win10
字典及相關操作
2019-03-06
列表及相關操作
2019-03-05
oracle資料庫建立、刪除索引等操作
2020-09-30
Oracle資料庫索引
批量刪除 redis keys
2021-08-22
Redis
Redis Cluster高可用叢集線上遷移操作記錄
2018-10-24
Redis
mysql刪除一條記錄
2020-04-04
MySql
使用者對某條賬單記錄的刪除操作
2024-10-26
Laravel 記錄相關
2019-06-15
Laravel
ePWM相關記錄
2024-11-06
linux相關記錄
2020-11-24
Linux
Linux批量刪除檔案
2018-07-05
Linux
批量刪除容器和映象
2021-11-28
git 批量刪除本地分支
2021-09-07
Git
刪除 AP 發票相關指令碼
2018-03-15
指令碼
安全叢集訪問非安全叢集問題記錄
2020-12-03
Elasticsearch叢集運維相關知識
2018-11-21
Elasticsearch運維
GlusterFS分散式儲存叢集部署記錄-相關補充
2018-04-10
分散式
ELK相關幫助文件
2019-01-08
windows10更新記錄刪除_怎樣刪除win10更新歷史記錄
2019-11-27
WindowsWin10
Centos7下ELK+Redis日誌分析平臺的叢集環境部署記錄
2018-05-29
CentOSRedis
MySQL索引分類及相關概念辨析
2022-04-27
MySql索引

ELK批量刪除索引及叢集相關操作記錄

相關文章