介紹
Redis Sentinel 是一個分散式系統, 你可以在一個架構中執行多個 Sentinel 程式(progress), 這些程式使用流言協議(gossip protocols)來接收關於主伺服器是否下線的資訊, 並使用投票協議(agreement protocols)來決定是否執行自動故障遷移, 以及選擇哪個從伺服器作為新的主伺服器。
雖然 Redis Sentinel 釋出為一個單獨的可執行檔案 redis-sentinel , 但實際上它只是一個執行在特殊模式下的 Redis 伺服器, 你可以在啟動一個普通 Redis 伺服器時通過給定 --sentinel 選項來啟動 Redis Sentinel 。
Sentinel 系統用於管理多個 Redis 伺服器(instance), 該系統執行以下三個任務:
- 監控(Monitoring): Sentinel 會不斷地檢查你的主伺服器和從伺服器是否運作正常。
- 提醒(Notification): 當被監控的某個 Redis 伺服器出現問題時, Sentinel 可以通過 API 向管理員或者其他應用程式傳送通知。
- 自動故障遷移(Automatic failover): 當一個主伺服器不能正常工作時, Sentinel 會開始一次自動故障遷移操作, 它會將失效主伺服器的其中一個從伺服器升級為新的主伺服器, 並讓失效主伺服器的其他從伺服器改為複製新的主伺服器; 當客戶端試圖連線失效的主伺服器時, 叢集也會向客戶端返回新主伺服器的地址, 使得叢集可以使用新主伺服器代替失效伺服器。
redis版本:3.2.11
ip:192.168.137.40
主:6379 ,sentinel:26379
從:6380 ,sentinel:26380
配置
當主當機了從接替主成為新的主,當機的主啟動後自動變成了從,其實它和Mysql的雙主模式是一樣的互為主從;redis哨兵需要用到redis-sentinel程式和sentinel.conf配置檔案。
mkdir -p /usr/local/redis mkdir -p /usr/local/redis/6379 mkdir -p /usr/local/redis/6380 mkdir -p /usr/local/redis/redis_cluster
主配置
vim redis_6379.conf
daemonize yes pidfile /usr/local/redis/6379/redis_6379.pid port 6379 tcp-backlog 128 timeout 0 tcp-keepalive 0 loglevel notice logfile "" databases 16 save 900 1 ###save save 300 10 save 60 10000 stop-writes-on-bgsave-error yes rdbcompression yes rdbchecksum yes dbfilename dump.rdb ###dbfile dir "/usr/local/redis/6379" masterauth "123456" requirepass "123456" slave-serve-stale-data yes slave-read-only yes repl-diskless-sync no repl-diskless-sync-delay 5 repl-disable-tcp-nodelay no slave-priority 100 appendonly yes appendfilename "appendonly.aof" appendfsync everysec no-appendfsync-on-rewrite no auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb aof-load-truncated yes lua-time-limit 5000 slowlog-log-slower-than 10000 slowlog-max-len 128 latency-monitor-threshold 0 notify-keyspace-events "" hash-max-ziplist-entries 512 hash-max-ziplist-value 64 list-max-ziplist-entries 512 list-max-ziplist-value 64 set-max-intset-entries 512 zset-max-ziplist-entries 128 zset-max-ziplist-value 64 hll-sparse-max-bytes 3000 activerehashing yes client-output-buffer-limit normal 0 0 0 client-output-buffer-limit slave 256mb 64mb 60 client-output-buffer-limit pubsub 32mb 8mb 60 hz 10 aof-rewrite-incremental-fsync yes
vim sentinel_1.conf
群集檔案配置
port 26379 dir "/usr/local/redis/redis_cluster" # 守護程式模式 daemonize yes # 指明日誌檔名 logfile "/usr/local/redis/redis_cluster/sentinel_26379.log" sentinel monitor mymaster 192.168.137.40 6379 2 sentinel down-after-milliseconds mymaster 5000 sentinel failover-timeout mymaster 18000 sentinel auth-pass mymaster 123456
從配置
vim redis_6380.conf
daemonize yes pidfile "/usr/local/redis/6380/redis_6380.pid" port 6380 tcp-backlog 128 timeout 0 tcp-keepalive 0 loglevel notice logfile "" databases 16 save 900 1 save 300 10 save 60 10000 stop-writes-on-bgsave-error yes rdbcompression yes rdbchecksum yes dbfilename "dump.rdb" dir "/usr/local/redis/6380" masterauth "123456" requirepass "123456" slave-serve-stale-data yes slave-read-only yes repl-diskless-sync no repl-diskless-sync-delay 5 repl-disable-tcp-nodelay no slave-priority 100 appendonly yes appendfilename "appendonly.aof" appendfsync everysec no-appendfsync-on-rewrite no auto-aof-rewrite-percentage 100 auto-aof-rewrite-min-size 64mb aof-load-truncated yes lua-time-limit 5000 slowlog-log-slower-than 10000 slowlog-max-len 128 latency-monitor-threshold 0 notify-keyspace-events "" hash-max-ziplist-entries 512 hash-max-ziplist-value 64 list-max-ziplist-entries 512 list-max-ziplist-value 64 set-max-intset-entries 512 zset-max-ziplist-entries 128 zset-max-ziplist-value 64 hll-sparse-max-bytes 3000 activerehashing yes client-output-buffer-limit normal 0 0 0 client-output-buffer-limit slave 256mb 64mb 60 client-output-buffer-limit pubsub 32mb 8mb 60 hz 10 aof-rewrite-incremental-fsync yes
vim sentinel_2.conf
#sentinel埠 port 26380 #工作路徑,注意路徑不要和主重複 dir "/usr/local/redis_cluster" # 守護程式模式 daemonize yes # 指明日誌檔名 logfile "/usr/local/redis_cluster/sentinel_26380.log" #哨兵監控的master,主從配置一樣,sentinel monitor <master-name> <ip> <redis-port> <quorum> sentinel monitor mymaster 192.168.137.40 6379 2 # master或slave多長時間(預設30秒)不能使用後標記為s_down狀態。 sentinel down-after-milliseconds mymaster 5000 #若sentinel在該配置值內未能完成failover操作(即故障時master/slave自動切換),則認為本次failover失敗。 sentinel failover-timeout mymaster 18000 #設定master和slaves驗證密碼 sentinel auth-pass mymaster 123456
注意:
1.應用程式連線到哨兵埠,通過指定不同的master名稱連線到具體的主副本。
2.哨兵配置檔案中只需要配置主從複製中的主副本ip和埠即可,當主從進行切換時哨兵會自動修改哨兵配置檔案中的主副本ip為新在主副本ip。
3.一個哨兵配置檔案中可以同時配置監控多個主從複製。
4.單個哨兵就可以用來進行主從故障監控,但是如果只有一個sentinel程式,如果這個程式執行出錯,或者是網路堵塞,那麼將無法實現redis叢集的主備切換(單點問題);<quorum>這個2代表投票數,當2個sentinel認為一個master已經不可用了以後,將會觸發failover,才能真正認為該master已經不可用了。(sentinel叢集中各個sentinel也有互相通訊,通過gossip協議);所以合理的配置應該是同時啟動多個哨兵程式,並且最好是在不同的伺服器中啟動。
5.注意mymaster的需要在整個網路環境都是唯一的,哨兵之間會自動通過mastername去建立關聯關係只要網路環境是相通的。
啟動redis
主從都要啟動
src/redis-server redis.conf
登入到6380建立主從關係
redis-cli -p 6380 slaveof 192.168.137.40 6379
啟動哨兵
主從兩個哨兵都要啟動,還可以通過redis-server方式啟動,例如“redis-server sentinel.conf --sentinel
”
src/redis-sentinel sentinel.conf
啟動報錯處理
錯誤1:
WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
兩個解決方法(overcommit_memory) 1. echo "vm.overcommit_memory=1" > /etc/sysctl.conf 或 vi /etcsysctl.conf , 然後reboot重啟機器 2. echo 1 > /proc/sys/vm/overcommit_memory 不需要啟機器就生效
overcommit_memory引數說明: 設定記憶體分配策略(可選,根據伺服器的實際情況進行設定) /proc/sys/vm/overcommit_memory 可選值:0、1、2。 0, 表示核心將檢查是否有足夠的可用記憶體供應用程式使用;如果有足夠的可用記憶體,記憶體申請允許;否則,記憶體申請失敗,並把錯誤返回給應用程式。 1, 表示核心允許分配所有的實體記憶體,而不管當前的記憶體狀態如何。 2, 表示核心允許分配超過所有實體記憶體和交換空間總和的記憶體 注意:redis在dump資料的時候,會fork出一個子程式,理論上child程式所佔用的記憶體和parent是一樣的,比如parent佔用 的記憶體為8G,這個時候也要同樣分配8G的記憶體給child,如果記憶體無法負擔,往往會造成redis伺服器的down機或者IO負載過高,效率下降。所 以這裡比較優化的記憶體分配策略應該設定為 1(表示核心允許分配所有的實體記憶體,而不管當前的記憶體狀態如何)。 這裡又涉及到Overcommit和OOM。 什麼是Overcommit和OOM 在Unix中,當一個使用者程式使用malloc()函式申請記憶體時,假如返回值是NULL,則這個程式知道當前沒有可用記憶體空間,就會做相應的處理工作。許多程式會列印錯誤資訊並退出。 Linux使用另外一種處理方式,它對大部分申請記憶體的請求都回復"yes",以便能跑更多更大的程式。因為申請記憶體後,並不會馬上使用記憶體。這種技術叫做Overcommit。 當記憶體不足時,會發生OOM killer(OOM=out-of-memory)。它會選擇殺死一些程式(使用者態程式,不是核心執行緒),以便釋放記憶體。 Overcommit的策略 Linux下overcommit有三種策略(Documentation/vm/overcommit-accounting): 0. 啟發式策略。合理的overcommit會被接受,不合理的overcommit會被拒絕。 1. 任何overcommit都會被接受。 2. 當系統分配的記憶體超過swap+N%*物理RAM(N%由vm.overcommit_ratio決定)時,會拒絕commit。 overcommit的策略通過vm.overcommit_memory設定。 overcommit的百分比由vm.overcommit_ratio設定。 # echo 2 > /proc/sys/vm/overcommit_memory # echo 80 > /proc/sys/vm/overcommit_ratio 當oom-killer發生時,linux會選擇殺死哪些程式 選擇程式的函式是oom_badness函式(在mm/oom_kill.c中),該函式會計算每個程式的點數(0~1000)。 點數越高,這個程式越有可能被殺死。 每個程式的點數跟oom_score_adj有關,而且oom_score_adj可以被設定(-1000最低,1000最高)。
錯誤2:
WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
echo 511 > /proc/sys/net/core/somaxconn
錯誤3:
16433:X 12 Jun 14:52:37.734 * Increased maximum number of open files to 10032 (it was originally set to 1024).
新裝的linux預設只有1024,當負載較大時,會經常出現error: too many open files ulimit -a:使用可以檢視當前系統的所有限制值 vim /etc/security/limits.conf 在檔案的末尾加上 * soft nofile 65535 * hard nofile 65535 執行su或者重新關閉連線使用者再執行ulimit -a就可以檢視修改後的結果。
故障切換機制
1. 啟動群集後,群集程式預設會在從庫的redis檔案中加入連線主的配置
# Generated by CONFIG REWRITE slaveof 192.168.137.40 6379
2.啟動群集之後,群集程式預設會在主從的sentinel.conf檔案中加入群集資訊
主:
port 26379 dir "/usr/local/redis-6379" # 守護程式模式 daemonize yes # 指明日誌檔名 logfile "./sentinel.log" sentinel monitor mymaster 192.168.137.40 6379 1 sentinel down-after-milliseconds mymaster 5000 sentinel failover-timeout mymaster 18000 sentinel auth-pass mymaster 123456 # Generated by CONFIG REWRITE sentinel config-epoch mymaster 0 sentinel leader-epoch mymaster 1 sentinel known-slave mymaster 192.168.137.40 6380 sentinel known-sentinel mymaster 192.168.137.40 26380 c77c5f64aaad0137a228875e531c7127ceeb5c3f sentinel current-epoch 1
從:
#sentinel埠 port 26380 #工作路徑 dir "/usr/local/redis-6380" # 守護程式模式 daemonize yes # 指明日誌檔名 logfile "./sentinel.log" #哨兵監控的master,主從配置一樣,在進行主從切換時6379會變成當前的master埠, sentinel monitor mymaster 192.168.137.40 6379 1 # master或slave多長時間(預設30秒)不能使用後標記為s_down狀態。 sentinel down-after-milliseconds mymaster 5000 #若sentinel在該配置值內未能完成failover操作(即故障時master/slave自動切換),則認為本次failover失敗。 sentinel failover-timeout mymaster 18000 #設定master和slaves驗證密碼 sentinel auth-pass mymaster 123456 #哨兵程式自動新增的部分 # Generated by CONFIG REWRITE sentinel config-epoch mymaster 0 sentinel leader-epoch mymaster 1 ###指明瞭當前群集的從庫的ip和埠,在主從切換時該值會改變 sentinel known-slave mymaster 192.168.137.40 6380 ###除了當前的哨兵還有哪些監控的哨兵 sentinel known-sentinel mymaster 192.168.137.40 26379 7a88891a6147e202a53601ca16a3d438e9d55c9d sentinel current-epoch 1
模擬主故障
[root@monitor redis-6380]# ps -ef|grep redis root 4171 1 0 14:20 ? 00:00:15 /usr/local/redis-6379/src/redis-server *:6379 root 4175 1 0 14:20 ? 00:00:15 /usr/local/redis-6380/src/redis-server *:6380 root 4305 1 0 15:28 ? 00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel] root 4306 1 0 15:28 ? 00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel] root 4337 4144 0 15:56 pts/1 00:00:00 grep redis [root@monitor redis-6380]# kill -9 4171 [root@monitor redis-6380]# ps -ef|grep redis root 4175 1 0 14:20 ? 00:00:15 /usr/local/redis-6380/src/redis-server *:6380 root 4305 1 0 15:28 ? 00:00:05 /usr/local/redis-6379/src/redis-sentinel *:26379 [sentinel] root 4306 1 0 15:28 ? 00:00:05 /usr/local/redis-6380/src/redis-sentinel *:26380 [sentinel] root 4339 4144 0 15:56 pts/1 00:00:00 grep redis [root@monitor redis-6380]#
從哨兵配置檔案中可以看到當前的主庫的已經發生了改變
從日誌檔案也可以看到當前的主已經從6379轉換成了6380
redis配置檔案官方說明:https://raw.githubusercontent.com/antirez/redis/3.0/redis.conf
總結
redis的哨兵埠26379、26380使用客戶端軟體無法連線,使用程式可以連線,客戶端軟體只能直接連線6379和6380埠。使用哨兵監控當主故障後會自動切換從為主,當主啟動後就變成了從。有看到別人只配置單哨兵26379的這種情況,這種情況無法保證哨兵程式自身的高可用。
備註: 作者:pursuer.chen 部落格:http://www.cnblogs.com/chenmh 本站點所有隨筆都是原創,歡迎大家轉載;但轉載時必須註明文章來源,且在文章開頭明顯處給明連結。 《歡迎交流討論》 |