Redis服務之高可用元件sentinel

1874發表於2020-08-04

　　前文我們瞭解了redis的常用資料型別相關命令的使用和說明，回顧請參考https://www.cnblogs.com/qiuhom-1874/p/13419690.html；今天我們來聊一下redis的高可用元件sentinel；首先來回顧下redis的主從同步，主從同步最主要的作用是讓master的資料在其他伺服器上實時存在副本，起到了備份的效果；對於redis的讀寫來說，主從架構能夠讓讀的請求分散到多個從伺服器上，從而降低了單臺redis讀請求的io壓力，同時也提高了redis讀請求的併發能力；通常為了資料的一致性，從伺服器一旦成為某一臺redis的slave，那麼從伺服器上之前有的資料會被清空，然後把master傳送過來的資料應用到記憶體，從而實現和master資料一致；除此之外slave通常會是隻讀屬性，也就說slave端只能執行讀操作，寫操作會被拒絕，所以寫請求始終是由master來完成；那麼問題來了，對於這種主從複製架構的環境中，如果master當機了，master當機意味著整個系統將不能夠寫資料到redis,很顯然這種情況我們應該及時解決；怎麼解決呢？有沒有這樣的一元件幫我們對master做實時的監控，一旦發現master當機就提升一個slave當選新的master，如果原master還有其他slave，將其他slave都從屬於新的master；除此之外它還應該讓系統在發生切換master時觸發報警通知，讓管理員儘快把壞掉的master修復上線；對，sentinel就有我們上述的這些功能，它能夠監控主從同步叢集中的master節點，在master發生當機後能夠自動故障轉移，將提升一臺slave作為新的master，然後通知管理員；

　　Sentinel是一個分散式系統，我們可以在一個架構中執行多個sentinel，這些sentinel程式使用流言協議（gossipprotocols）來接收關於 Master是否下線的資訊，並使用投票協議(Agreement Protocols)來決定是否執行自動故障遷移,以及選擇哪個 Slave 作為新的 Master。每個sentinel程式會向其他sentinel程式、master、slave定時傳送訊息，以確保對方是否”活”著，如果發現對方在指定配置時間(可配置的)內未得到回應，則暫時認為對方已掉線，也就是所謂的”主觀認為當機” ，英文名稱：Subjective Down，簡稱 SDOWN。有主觀當機，肯定就有客觀當機。當多個sentinel程式中多數的sentinel程式在對 Master 做出 SDOWN 的判斷，並且通過 SENTINEL is-master-down-by-addr 命令互相交流之後，得出的 Master Server 下線判斷，這種方式就是“客觀當機”，英文名稱是：Objectively Down，簡稱 ODOWN。通過一定的 vote 演算法，從剩下的 slave 從伺服器節點中，選一臺提升為 Master 伺服器節點，然後自動修改相關配置，並開啟故障轉移（failover）。

　　配置使用sentinel

　　環境說明

角色	ip地址	埠
master	192.168.0.41	6379
slave01	192.168.0.42	6379
slave02	192.168.0.43	6379
sentinel01	192.168.0.41	26379
sentinel02	192.168.0.42	26379
sentinel03	192.168.0.43	26379

　　架構圖

　　提示：從上面的架構圖可以知道，首先我們必須要有一個主從架構的叢集，然後在部署sentinel 來對主從同步叢集做監控；

　　redis主從複製叢集搭建

　　1、在192.168.0.41/42/43上安裝redis，可以使用yum安裝，也可以使用編譯安裝，redis安裝請參考https://www.cnblogs.com/qiuhom-1874/p/13378138.html；

　　2、配置192.168.0.41/42/43上的redis監聽在非本機127.0.0.1上並配置42/43上的redis從屬於192.168.0.41

　　master

　　slave01

　　slave02

　　提示：redis支援線上修改配置，儲存配置到配置檔案；SLAVEOF 指令用於指定redismaster的ip地址和埠，表示把該redis配置成對應master的slave角色；CONFIG REWRITE是把我們的配置儲存到配置檔案；

　　在master上檢視是否有兩個從節點連線到master

　　驗證：在master上寫資料，看看是否能夠及時同步到兩個slave上？

　　提示：可以看到在主庫上寫資料，從庫上能夠及時的同步主庫上的資料；到此redis的主從叢集就搭建完畢了；

　　配置sentinel，讓其監控master

　　提示：三個sentinel的配置都是一樣的，這裡需要明確指定監控主從同步叢集的master的ip地址和埠，以及有效法定票數，有效法定票數指的是至少有多少個sentinel主觀認為master down了，然後才觸發選舉新master操作；通常在這種流言協議中，一般都是大於叢集半數，如果是3臺sentinel，至少要2臺主觀認為master當機，才開始觸發選舉新master；如果是5臺，那至少要3臺；如果master配置的有認證密碼，我們還需要在sentinel中指定認證密碼；

　　sentinel配置檔案說明

　　bind：該指令和redis配置檔案中的bind是同樣的用法，用於指定sentinel的監聽地址；預設不指定，監聽本機所有可用地址；

　　protected-mode：指定是否開啟保護模式；

　　port：用於指定sentinel的監聽埠；預設是26379

　　daemonize：用於指定sentinel是否執行為守護程式，yes表示執行為後臺守護程式；no表示不執行為守護程式，直接在前臺執行；

　　pidfile：指定pid檔案路徑；

　　logfile：指定日誌檔案路徑；

　　dir：指定sentinel的工作路徑；

　　sentinel monitor <master-name> <ip> <redis-port> <quorum>：用於指定監控master節點的ip地址和埠以及有效法定票數；其中<master-name>是給監控的master一個名稱，可以隨便寫，起標識的作用；<quorum>表示sentinel叢集的quorum機制，即至少有quorum個sentinel節點同時判定主節點故障時，才認為其真的故障；

　　sentinel auth-pass <master-name> <password>：指定master認證密碼；通常都需要設定密碼，並且master的密碼和slave的密碼應該是一樣；

　　sentinel down-after-milliseconds <master-name> <milliseconds>：配置監控到指定的叢集的主節點異常狀態持續多久方才將標記為“故障”；

　　sentinel parallel-syncs <master-name> <numslaves>：指在failover過程中，能夠被sentinel並行配置的從節點的數量；

　　sentinel failover-timeout <master-name> <milliseconds>：sentinel必須在此指定的時長內完成故障轉移操作，否則，將視為故障轉移操作失敗；

　　sentinel notification-script <master-name> <script-path>：通知指令碼，此指令碼被自動傳遞多個引數；

　　瞭解了sentinel的配置檔案，接下我們把3臺sentinel都啟動起來

　　master

　　slave01

　　slave02

　　提示：從上面的資訊可以看到3個sentinel都監空master的ip地址和埠，他們3個的配置檔案都是一樣的；

　　檢視sentinel日誌

　　提示：從上面的日誌資訊可以瞭解到sentinel監控的master是192.168.0.41：6379；並且有兩個slave分別是192.168.0.42：6379和192.168.0.43：6379；

　　檢視sentinel狀態

　　提示：它提示我們開啟了保護模式；

　　關閉保護模式

　　重啟sentinel，再次檢視sentinel狀態

[root@master ~]# systemctl restart redis-sentinel.service 
[root@master ~]# ss -tnl
State      Recv-Q Send-Q        Local Address:Port                       Peer Address:Port              
LISTEN     0      511                       *:26379                                 *:*                  
LISTEN     0      511                       *:6379                                  *:*                  
LISTEN     0      128                       *:22                                    *:*                  
LISTEN     0      100               127.0.0.1:25                                    *:*                  
LISTEN     0      511                      :::26379                                :::*                  
LISTEN     0      128                      :::22                                   :::*                  
LISTEN     0      100                     ::1:25                                   :::*                  
[root@master ~]# redis-cli -h 192.168.0.41 -p 26379       
192.168.0.41:26379> info sentinel
# Sentinel
sentinel_masters:1
sentinel_tilt:0
sentinel_running_scripts:0
sentinel_scripts_queue_length:0
sentinel_simulate_failure_flags:0
master0:name=mymaster,status=ok,address=192.168.0.41:6379,slaves=2,sentinels=3
192.168.0.41:26379> info clients
# Clients
connected_clients:3
client_longest_output_list:0
client_biggest_input_buf:0
blocked_clients:0
192.168.0.41:26379> CLIENT LIST
id=2 addr=192.168.0.42:59048 fd=14 name=sentinel-f60b324b-cmd age=38 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=0 obl=0 oll=0 omem=0 events=r cmd=ping
id=3 addr=192.168.0.43:37480 fd=15 name=sentinel-eada229c-cmd age=38 idle=1 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=0 obl=0 oll=0 omem=0 events=r cmd=publish
id=4 addr=192.168.0.41:36706 fd=16 name= age=32 idle=0 flags=N db=0 sub=0 psub=0 multi=-1 qbuf=0 qbuf-free=32768 obl=0 oll=0 omem=0 events=r cmd=client
192.168.0.41:26379>

　　提示：從上面的狀態資訊可以看到當前我們sentinel監控的master是出於正常ok狀態，有兩個slave和3個sentinel；對於192.168.0.41：26379目前有3個客戶端連線，二個是sentinel，一個本機；到此3臺sentinel搭建啟動完成；

　　驗證：把master當機，看看sentinel是否將在兩個從節點選舉一個為新master？是否將另外一個slave重新指向新master？

　　在slave02上檢視主從同步資訊

　　提示：第一次檢視只是告訴我們master當機了，第二次檢視就告訴我們當前節點為master，並且擁有一個slave節點；

　　在192.168.0.43上檢視主從資訊，看看是否指向新的master？

　　提示：在slave02上看主從同步資訊，可以看到slave02已經從屬新master了；

　　檢視故障轉移時 sentinel日誌

　　提示：從上面的日誌資訊可以瞭解到，在從sdown到odown後，就會觸發vote演算法開始選舉leader；然後將原master降級為slave，然後將選舉出來的leader原salve屬性去除（slaveof no one）;然後提示新master，然後將剩下的slave重新配置新master為主；最後是切換master，開始新的監控；

　　檢視故障轉移後的 s redis 配置檔案

　　提示：故障轉移後 redis.conf 中的 slaveof 行的 master IP 會被修改，sentinel.conf 中的 sentinel monitor IP 會被修改。同時在sentinel配置檔案的末尾還會有新增known-slave和known-sentinel等資訊；

　　修復舊master 讓其重新上線

　　提示：把原master啟動後，它自動就成為了新主的slave；這主要是因為sentinel在故障轉移時把其配置檔案中的slaveof 修改成新的master地址了；

　　在新master上檢視主從同步資訊

　　提示：在沒有恢復原master時，在新master上檢視主從同步資訊，只能看到一個salve，啟動原master後，在看就有兩個slave是線上；

Redis高可用 Sentinel
2018-04-02
Redis
Redis 哨兵高可用（Sentinel）
2021-02-12
Redis
一篇搞定Sentinel-搭建Spring Cloud Alibaba服務元件Sentinel實現服務資源控制
2023-11-01
SpringCloud元件
微服務元件 Sentinel（三）
2022-08-06
微服務元件
微服務元件 Sentinel（二）
2022-08-05
微服務元件
微服務元件 Sentinel（一）
2022-08-03
微服務元件
Keepalived之高可用LVS叢集
2020-09-13
Redis——Sentinel
2018-07-16
Redis
《吃透微服務》 - 服務容錯之Sentinel
2021-06-27
微服務
Redis服務監控之RedisLive安裝部署（親測可用）
2019-05-23
Redis
React手稿之高階元件
2018-11-15
React元件
Redis哨兵sentinel
2019-04-12
Redis
Redis sentinel搭建
2020-10-01
Redis
使用 Docker Compose 本地部署基於 Sentinel 的高可用 Redis 叢集
2018-03-04
DockerRedis
Spring Redis開啟事務支援錯誤用法導致服務不可用
2020-06-28
SpringRedis
React教程之高階元件
2019-03-15
React元件
SpringCloudAlibaba-服務容錯Sentinel（入門）
2020-08-09
SpringGCCloud
微服務實戰（八）整合Sentinel閘道器服務限流功能 SpringCloud GateWay + Sentinel + Nacos
2020-02-12
微服務SpringGCCloudGateway
Redis服務之Redis Cluster
2020-08-06
Redis
基於Redis的低成本高可用排行榜服務構建
2018-07-12
Redis
【Redis】Sentinel 哨兵模式
2021-12-05
Redis模式
DRBD物理同步方式實現MySQL之高可用
2021-04-25
MySql
React高階指南之高階元件
2018-08-18
React元件
React 重溫之高階元件（HOC）
2018-06-13
React元件
Spring Cloud Alibaba | Sentinel: 服務限流基礎篇
2019-07-19
SpringCloud
Spring Cloud Alibaba | Sentinel: 服務限流高階篇
2019-07-20
SpringCloud
redis:新增redis到服務列表
2024-08-08
Redis
WEB叢集- 高可用服務
2024-11-05
Web
Keepalived實現服務高可用
2021-04-16
redis sentinel配置啟動
2020-11-13
Redis
redis sentinel哨兵例項
2020-10-25
Redis
Redis Sentinel哨兵模式部署
2024-06-16
Redis模式
聊聊Redis sentinel 機制
2023-04-16
Redis
Redis Sentinel實現原理
2020-12-03
Redis
SpringCloudAlibaba 微服務講解（四）Sentinel--服務容錯（二）
2022-04-01
SpringGCCloud微服務
SpringCloudAlibaba 微服務講解（四）Sentinel--服務容錯（一）
2022-03-29
SpringGCCloud微服務
高可用服務之Keepalived利用指令碼實現服務的可用性檢測
2020-09-14
指令碼
Android架構之高可用行動網路連線
2019-03-03
Android架構

Redis服務之高可用元件sentinel

相關文章