Nginx+keepalived 雙機熱備（主從模式）

散盡浮華發表於2016-12-06

負載均衡技術對於一個網站尤其是大型網站的web伺服器叢集來說是至關重要的！做好負載均衡架構，可以實現故障轉移和高可用環境，避免單點故障，保證網站健康持續執行。
關於負載均衡介紹，可以參考：linux負載均衡總結性說明（四層負載/七層負載）

由於業務擴充套件，網站的訪問量不斷加大，負載越來越高。現需要在web前端放置nginx負載均衡,同時結合keepalived對前端nginx實現HA高可用。
1）nginx程式基於Master+Slave(worker)多程式模型，自身具有非常穩定的子程式管理功能。在Master程式分配模式下，Master程式永遠不進行業務處理，只是進行任務分發，從而達到Master程式的存活高可靠性，Slave(worker)程式所有的業務訊號都由主程式發出，Slave(worker)程式所有的超時任務都會被Master中止，屬於非阻塞式任務模型。
2）Keepalived是Linux下面實現VRRP備份路由的高可靠性執行件。基於Keepalived設計的服務模式能夠真正做到主伺服器和備份伺服器故障時IP瞬間無縫交接。二者結合，可以構架出比較穩定的軟體LB方案。

Keepalived介紹：
Keepalived是一個基於VRRP協議來實現的服務高可用方案，可以利用其來避免IP單點故障，類似的工具還有heartbeat、corosync、pacemaker。但是它一般不會單獨出現，而是與其它負載均衡技術（如lvs、haproxy、nginx）一起工作來達到叢集的高可用。

VRRP協議：
VRRP全稱 Virtual Router Redundancy Protocol，即虛擬路由冗餘協議。可以認為它是實現路由器高可用的容錯協議，即將N臺提供相同功能的路由器組成一個路由器組(Router Group)，這個組裡面有一個master和多個backup，但在外界看來就像一臺一樣，構成虛擬路由器，擁有一個虛擬IP（vip，也就是路由器所在區域網內其他機器的預設路由），佔有這個IP的master實際負責ARP相應和轉發IP資料包，組中的其它路由器作為備份的角色處於待命狀態。master會發組播訊息，當backup在超時時間內收不到vrrp包時就認為master宕掉了，這時就需要根據VRRP的優先順序來選舉一個backup當master，保證路由器的高可用。

在VRRP協議實現裡，虛擬路由器使用 00-00-5E-00-01-XX 作為虛擬MAC地址，XX就是唯一的 VRID （Virtual Router IDentifier），這個地址同一時間只有一個物理路由器佔用。在虛擬路由器裡面的物理路由器組裡面通過多播IP地址 224.0.0.18 來定時傳送通告訊息。每個Router都有一個 1-255 之間的優先順序別，級別最高的（highest priority）將成為主控（master）路由器。通過降低master的優先權可以讓處於backup狀態的路由器搶佔（pro-empt）主路由器的狀態，兩個backup優先順序相同的IP地址較大者為master，接管虛擬IP。

keepalived與heartbeat/corosync等比較：
Heartbeat、Corosync、Keepalived這三個叢集元件我們到底選哪個好呢？
首先要說明的是，Heartbeat、Corosync是屬於同一型別，Keepalived與Heartbeat、Corosync，根本不是同一型別的。
Keepalived使用的vrrp協議方式，虛擬路由冗餘協議 (Virtual Router Redundancy Protocol，簡稱VRRP)；
Heartbeat或Corosync是基於主機或網路服務的高可用方式；
簡單的說就是，Keepalived的目的是模擬路由器的高可用，Heartbeat或Corosync的目的是實現Service的高可用。
所以一般Keepalived是實現前端高可用，常用的前端高可用的組合有，就是我們常見的LVS+Keepalived、Nginx+Keepalived、HAproxy+Keepalived。而Heartbeat或Corosync是實現服務的高可用，常見的組合有Heartbeat v3(Corosync)+Pacemaker+NFS+Httpd 實現Web伺服器的高可用、Heartbeat v3(Corosync)+Pacemaker+NFS+MySQL 實現MySQL伺服器的高可用。總結一下，Keepalived中實現輕量級的高可用，一般用於前端高可用，且不需要共享儲存，一般常用於兩個節點的高可用。而Heartbeat(或Corosync)一般用於服務的高可用，且需要共享儲存，一般用於多節點的高可用。這個問題我們說明白了。

那heartbaet與corosync又應該選擇哪個好？
一般用corosync，因為corosync的執行機制更優於heartbeat，就連從heartbeat分離出來的pacemaker都說在以後的開發當中更傾向於corosync，所以現在corosync+pacemaker是最佳組合。

雙機高可用一般是通過虛擬IP（飄移IP）方法來實現的，基於Linux/Unix的IP別名技術。
雙機高可用方法目前分為兩種：
1）雙機主從模式：即前端使用兩臺伺服器，一臺主伺服器和一臺熱備伺服器，正常情況下，主伺服器繫結一個公網虛擬IP，提供負載均衡服務，熱備伺服器處於空閒狀態；當主伺服器發生故障時，熱備伺服器接管主伺服器的公網虛擬IP，提供負載均衡服務；但是熱備伺服器在主機器不出現故障的時候，永遠處於浪費狀態，對於伺服器不多的網站，該方案不經濟實惠。
2）雙機主主模式：即前端使用兩臺負載均衡伺服器，互為主備，且都處於活動狀態，同時各自繫結一個公網虛擬IP，提供負載均衡服務；當其中一臺發生故障時，另一臺接管發生故障伺服器的公網虛擬IP（這時由非故障機器一臺負擔所有的請求）。這種方案，經濟實惠，非常適合於當前架構環境。

今天在此分享下Nginx+keepalived實現高可用負載均衡的主從模式的操作記錄：

keepalived可以認為是VRRP協議在Linux上的實現，主要有三個模組，分別是core、check和vrrp。
core模組為keepalived的核心，負責主程式的啟動、維護以及全域性配置檔案的載入和解析。
check負責健康檢查，包括常見的各種檢查方式。
vrrp模組是來實現VRRP協議的。

一、環境說明：
作業系統：centos6.8，64位
master機器（master-node）：103.110.98.14/192.168.1.14
slave機器（slave-node）：103.110.98.24/192.168.1.24
公用的虛擬IP（VIP）：103.110.98.20 //負載均衡器上配置的域名都解析到這個VIP上

應用環境如下：

二、環境安裝
安裝nginx和keepalive服務（master-node和slave-node兩臺伺服器上的安裝操作完全一樣）。
安裝依賴
[root@master-node ~]# yum -y install gcc pcre-devel zlib-devel openssl-devel
下載（百度雲盤下載地址：https://pan.baidu.com/s/1ckTOKI 提取祕鑰：gi8i）
[root@master-node ~]# cd /usr/local/src/
[root@master-node src]# wget http://nginx.org/download/nginx-1.9.7.tar.gz
[root@master-node src]# wget http://www.keepalived.org/software/keepalived-1.3.2.tar.gz
安裝nginx
[root@master-node src]# tar -zvxf nginx-1.9.7.tar.gz
[root@master-node src]# cd nginx-1.9.7
新增www使用者，其中-M參數列示不新增使用者家目錄，-s參數列示指定shell型別
[root@master-node nginx-1.9.7]# useradd www -M -s /sbin/nologin
[root@master-node nginx-1.9.7]# vim auto/cc/gcc
#將這句註釋掉取消Debug編譯模式大概在179行
#CFLAGS="$CFLAGS -g"
[root@master-node nginx-1.9.7]# ./configure --prefix=/usr/local/nginx --user=www --group=www --with-http_ssl_module --with-http_flv_module --with-http_stub_status_module --with-http_gzip_static_module --with-pcre
[root@master-node nginx-1.9.7]# make && make install
安裝keepalived
[root@master-node src]# tar -zvxf keepalived-1.3.2.tar.gz
[root@master-node src]# cd keepalived-1.3.2
[root@master-node keepalived-1.3.2]# ./configure
[root@master-node keepalived-1.3.2]# make && make install
[root@master-node keepalived-1.3.2]# cp /usr/local/src/keepalived-1.3.2/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/
[root@master-node keepalived-1.3.2]# cp /usr/local/etc/sysconfig/keepalived /etc/sysconfig/
[root@master-node keepalived-1.3.2]# mkdir /etc/keepalived
[root@master-node keepalived-1.3.2]# cp /usr/local/etc/keepalived/keepalived.conf /etc/keepalived/
[root@master-node keepalived-1.3.2]# cp /usr/local/sbin/keepalived /usr/sbin/
將nginx和keepalive服務加入開機啟動服務
[root@master-node keepalived-1.3.2]# echo "/usr/local/nginx/sbin/nginx" >> /etc/rc.local
[root@master-node keepalived-1.3.2]# echo "/etc/init.d/keepalived start" >> /etc/rc.local

三、配置服務

先關閉SElinux、配置防火牆（master和slave兩臺負載均衡機都要做）
[root@master-node ~]# vim /etc/sysconfig/selinux
#SELINUX=enforcing #註釋掉
#SELINUXTYPE=targeted #註釋掉
SELINUX=disabled #增加
[root@master-node ~]# setenforce 0 #使配置立即生效

[root@master-node ~]# vim /etc/sysconfig/iptables
.......
-A INPUT -s 103.110.98.0/24 -d 224.0.0.18 -j ACCEPT #允許組播地址通訊
-A INPUT -s 192.168.1.0/24 -d 224.0.0.18 -j ACCEPT
-A INPUT -s 103.110.98.0/24 -p vrrp -j ACCEPT #允許 VRRP（虛擬路由器冗餘協）通訊
-A INPUT -s 192.168.1.0/24 -p vrrp -j ACCEPT
-A INPUT -p tcp -m state --state NEW -m tcp --dport 80 -j ACCEPT #開通80埠訪問

[root@master-node ~]# /etc/init.d/iptables restart #重啟防火牆使配置生效

1.配置nginx
master-node和slave-node兩臺伺服器的nginx的配置完全一樣,主要是配置/usr/local/nginx/conf/nginx.conf的http，當然也可以配置vhost虛擬主機目錄，然後配置vhost下的比如LB.conf檔案。
其中:
多域名指向是通過虛擬主機（配置http下面的server）實現;
同一域名的不同虛擬目錄通過每個server下面的不同location實現;
到後端的伺服器在vhost/LB.conf下面配置upstream,然後在server或location中通過proxy_pass引用。
要實現前面規劃的接入方式，LB.conf的配置如下（新增proxy_cache_path和proxy_temp_path這兩行，表示開啟nginx的快取功能）：

[root@master-node ~]# vim /usr/local/nginx/conf/nginx.conf
user  www;
worker_processes  8;

#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;

#pid        logs/nginx.pid;


events {
    worker_connections  65535;
}


http {
    include       mime.types;
    default_type  application/octet-stream;
    charset utf-8;
      
    ######
    ## set access log format
    ######
    log_format  main  '$http_x_forwarded_for $remote_addr $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_cookie" $host $request_time';

    #######
    ## http setting
    #######
    sendfile       on;
    tcp_nopush     on;
    tcp_nodelay    on;
    keepalive_timeout  65;
    proxy_cache_path /var/www/cache levels=1:2 keys_zone=mycache:20m max_size=2048m inactive=60m;
    proxy_temp_path /var/www/cache/tmp; 

    fastcgi_connect_timeout 3000;
    fastcgi_send_timeout 3000;
    fastcgi_read_timeout 3000;
    fastcgi_buffer_size 256k;
    fastcgi_buffers 8 256k;
    fastcgi_busy_buffers_size 256k;
    fastcgi_temp_file_write_size 256k;
    fastcgi_intercept_errors on;

    #
    client_header_timeout 600s;
    client_body_timeout 600s;
   # client_max_body_size 50m;
    client_max_body_size 100m;               #允許客戶端請求的最大單個檔案位元組數
    client_body_buffer_size 256k;            #緩衝區代理緩衝請求的最大位元組數，可以理解為先儲存到本地再傳給使用者

    gzip  on;
    gzip_min_length  1k;
    gzip_buffers     4 16k;
    gzip_http_version 1.1;
    gzip_comp_level 9;
    gzip_types       text/plain application/x-javascript text/css application/xml text/javascript application/x-httpd-php;
    gzip_vary on;

    ## includes vhosts
    include vhosts/*.conf;
}

[root@master-node ~]# mkdir /usr/local/nginx/conf/vhosts
[root@master-node ~]# mkdir /var/www/cache
[root@master-node ~]# ulimit 65535

[root@master-node ~]# vim /usr/local/nginx/conf/vhosts/LB.conf
upstream LB-WWW {
      ip_hash;
      server 192.168.1.101:80 max_fails=3 fail_timeout=30s;     #max_fails = 3 為允許失敗的次數，預設值為1
      server 192.168.1.102:80 max_fails=3 fail_timeout=30s;     #fail_timeout = 30s 當max_fails次失敗後，暫停將請求分發到該後端伺服器的時間
      server 192.168.1.118:80 max_fails=3 fail_timeout=30s;
    }
   
upstream LB-OA {
      ip_hash;
      server 192.168.1.101:8080 max_fails=3 fail_timeout=30s;
      server 192.168.1.102:8080 max_fails=3 fail_timeout=30s;
}
         
  server {
      listen      80;
      server_name dev.wangshibo.com;
   
      access_log  /usr/local/nginx/logs/dev-access.log main;
      error_log  /usr/local/nginx/logs/dev-error.log;
   
      location /svn {
         proxy_pass http://192.168.1.108/svn/;
         proxy_redirect off ;
         proxy_set_header Host $host;
         proxy_set_header X-Real-IP $remote_addr;
         proxy_set_header REMOTE-HOST $remote_addr;
         proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
         proxy_connect_timeout 300;             #跟後端伺服器連線超時時間，發起握手等候響應時間
         proxy_send_timeout 300;                #後端伺服器回傳時間，就是在規定時間內後端伺服器必須傳完所有資料
         proxy_read_timeout 600;                #連線成功後等待後端伺服器的響應時間，已經進入後端的排隊之中等候處理
         proxy_buffer_size 256k;                #代理請求緩衝區,會儲存使用者的頭資訊以供nginx進行處理
         proxy_buffers 4 256k;                  #同上，告訴nginx儲存單個用幾個buffer最大用多少空間
         proxy_busy_buffers_size 256k;          #如果系統很忙時候可以申請最大的proxy_buffers
         proxy_temp_file_write_size 256k;       #proxy快取臨時檔案的大小
         proxy_next_upstream error timeout invalid_header http_500 http_503 http_404;
         proxy_max_temp_file_size 128m;
         proxy_cache mycache;                                 
         proxy_cache_valid 200 302 60m;                       
         proxy_cache_valid 404 1m; 
       }
   
      location /submin {
         proxy_pass http://192.168.1.108/submin/;
         proxy_redirect off ;
         proxy_set_header Host $host;
         proxy_set_header X-Real-IP $remote_addr;
         proxy_set_header REMOTE-HOST $remote_addr;
         proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
         proxy_connect_timeout 300;
         proxy_send_timeout 300;
         proxy_read_timeout 600;
         proxy_buffer_size 256k;
         proxy_buffers 4 256k;
         proxy_busy_buffers_size 256k;
         proxy_temp_file_write_size 256k;
         proxy_next_upstream error timeout invalid_header http_500 http_503 http_404;
         proxy_max_temp_file_size 128m;
         proxy_cache mycache;         
         proxy_cache_valid 200 302 60m;
         proxy_cache_valid 404 1m;
        }
    }
   
server {
     listen       80;
     server_name  www.wangshibo.com;
 
      access_log  /usr/local/nginx/logs/www-access.log main;
      error_log  /usr/local/nginx/logs/www-error.log;
 
     location / {
         proxy_pass http://LB-WWW;
         proxy_redirect off ;
         proxy_set_header Host $host;
         proxy_set_header X-Real-IP $remote_addr;
         proxy_set_header REMOTE-HOST $remote_addr;
         proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
         proxy_connect_timeout 300;
         proxy_send_timeout 300;
         proxy_read_timeout 600;
         proxy_buffer_size 256k;
         proxy_buffers 4 256k;
         proxy_busy_buffers_size 256k;
         proxy_temp_file_write_size 256k;
         proxy_next_upstream error timeout invalid_header http_500 http_503 http_404;
         proxy_max_temp_file_size 128m;
         proxy_cache mycache;                                 
         proxy_cache_valid 200 302 60m;                       
         proxy_cache_valid 404 1m;
        }
}
  
 server {
       listen       80;
       server_name  oa.wangshibo.com;
 
      access_log  /usr/local/nginx/logs/oa-access.log main;
      error_log  /usr/local/nginx/logs/oa-error.log;
 
       location / {
         proxy_pass http://LB-OA;
         proxy_redirect off ;
         proxy_set_header Host $host;
         proxy_set_header X-Real-IP $remote_addr;
         proxy_set_header REMOTE-HOST $remote_addr;
         proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
         proxy_connect_timeout 300;
         proxy_send_timeout 300;
         proxy_read_timeout 600;
         proxy_buffer_size 256k;
         proxy_buffers 4 256k;
         proxy_busy_buffers_size 256k;
         proxy_temp_file_write_size 256k;
         proxy_next_upstream error timeout invalid_header http_500 http_503 http_404;
         proxy_max_temp_file_size 128m;
         proxy_cache mycache;                                 
         proxy_cache_valid 200 302 60m;                       
         proxy_cache_valid 404 1m;
        }
}

驗證方法（保證從負載均衡器本機到後端真實伺服器之間能正常通訊）：
1）首先在本機用IP訪問上面LB.cong中配置的各個後端真實伺服器的url
2）然後在本機用域名和路徑訪問上面LB.cong中配置的各個後端真實伺服器的域名/虛擬路徑

----------------------------------------------------------------------------------------------------------------------------
後端應用伺服器的nginx配置，這裡選擇192.168.1.108作為例子進行說明
由於這裡的192.168.1.108機器是openstack的虛擬機器，沒有外網ip，不能解析域名。
所以在server_name處也將ip加上，使得用ip也可以訪問。
[root@108-server ~]# cat /usr/local/nginx/conf/vhosts/svn.conf
server {
listen 80;
#server_name dev.wangshibo.com;
server_name dev.wangshibo.com 192.168.1.108;

access_log /usr/local/nginx/logs/dev.wangshibo-access.log main;
error_log /usr/local/nginx/logs/dev.wangshibo-error.log;

location / {
root /var/www/html;
index index.html index.php index.htm;
}
}

[root@108-server ~]# ll /var/www/html/
drwxr-xr-x. 2 www www 4096 Dec 7 01:46 submin
drwxr-xr-x. 2 www www 4096 Dec 7 01:45 svn
[root@108-server ~]# cat /var/www/html/svn/index.html
this is the page of svn/192.168.1.108
[root@108-server ~]# cat /var/www/html/submin/index.html
this is the page of submin/192.168.1.108

[root@108-server ~]# cat /etc/hosts
127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4
::1 localhost localhost.localdomain localhost6 localhost6.localdomain6
192.168.1.108 dev.wangshibo.com

[root@108-server ~]# curl http://dev.wangshibo.com //由於是內網機器不能聯網，亦不能解析域名。所以用域名訪問沒有反應。只能用ip訪問
[root@ops-server4 vhosts]# curl http://192.168.1.108
this is 192.168.1.108 page!!!
[root@ops-server4 vhosts]# curl http://192.168.1.108/svn/ //最後一個/符號要加上，否則訪問不了。
this is the page of svn/192.168.1.108
[root@ops-server4 vhosts]# curl http://192.168.1.108/submin/
this is the page of submin/192.168.1.108
----------------------------------------------------------------------------------------------------------------------------

然後在master-node和slave-node兩臺負載機器上進行測試（iptables防火牆要開通80埠）：
[root@master-node ~]# curl http://192.168.1.108/svn/
this is the page of svn/192.168.1.108
[root@master-node ~]# curl http://192.168.1.108/submin/
this is the page of submin/192.168.1.108

瀏覽器訪問：
在本機host繫結dev.wangshibo.com，如下，即繫結到master和slave機器的公網ip上測試是否能正常訪問（nginx+keepalive環境正式完成後，域名解析到的真正地址是VIP地址）
103.110.98.14 dev.wangshibo.com
103.110.98.24 dev.wangshibo.com

2.keepalived配置
1）master-node負載機上的keepalived配置（sendmail部署可以參考：linux下sendmail郵件系統安裝操作記錄）
[root@master-node ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@master-node ~]# vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived     #全域性定義
 
global_defs {
notification_email {     #指定keepalived在發生事件時(比如切換)傳送通知郵件的郵箱
ops@wangshibo.cn   #設定報警郵件地址，可以設定多個，每行一個。 需開啟本機的sendmail服務
tech@wangshibo.cn
}
 
notification_email_from ops@wangshibo.cn   #keepalived在發生諸如切換操作時需要傳送email通知地址
smtp_server 127.0.0.1      #指定傳送email的smtp伺服器
smtp_connect_timeout 30    #設定連線smtp server的超時時間
router_id master-node     #執行keepalived的機器的一個標識，通常可設為hostname。故障發生時，發郵件時顯示在郵件主題中的資訊。
}
 
vrrp_script chk_http_port {      #檢測nginx服務是否在執行。有很多方式，比如程式，用指令碼檢測等等
    script "/opt/chk_nginx.sh"   #這裡通過指令碼監測
    interval 2                   #指令碼執行間隔，每2s檢測一次
    weight -5                    #指令碼結果導致的優先順序變更，檢測失敗（指令碼返回非0）則優先順序 -5
    fall 2                    #檢測連續2次失敗才算確定是真失敗。會用weight減少優先順序（1-255之間）
    rise 1                    #檢測1次成功就算成功。但不修改優先順序
}
 
vrrp_instance VI_1 {    #keepalived在同一virtual_router_id中priority（0-255）最大的會成為master，也就是接管VIP，當priority最大的主機發生故障後次priority將會接管
    state MASTER    #指定keepalived的角色，MASTER表示此主機是主伺服器，BACKUP表示此主機是備用伺服器。注意這裡的state指定instance(Initial)的初始狀態，就是說在配置好後，這臺伺服器的初始狀態就是這裡指定的，但這裡指定的不算，還是得要通過競選通過優先順序來確定。如果這裡設定為MASTER，但如若他的優先順序不及另外一臺，那麼這臺在傳送通告時，會傳送自己的優先順序，另外一臺發現優先順序不如自己的高，那麼他會就回搶佔為MASTER
    interface em1          #指定HA監測網路的介面。例項繫結的網路卡，因為在配置虛擬IP的時候必須是在已有的網路卡上新增的
    mcast_src_ip 103.110.98.14  # 傳送多播資料包時的源IP地址，這裡注意了，這裡實際上就是在哪個地址上傳送VRRP通告，這個非常重要，一定要選擇穩定的網路卡埠來傳送，這裡相當於heartbeat的心跳埠，如果沒有設定那麼就用預設的繫結的網路卡的IP，也就是interface指定的IP地址
    virtual_router_id 51         #虛擬路由標識，這個標識是一個數字，同一個vrrp例項使用唯一的標識。即同一vrrp_instance下，MASTER和BACKUP必須是一致的
    priority 101                 #定義優先順序，數字越大，優先順序越高，在同一個vrrp_instance下，MASTER的優先順序必須大於BACKUP的優先順序
    advert_int 1                 #設定MASTER與BACKUP負載均衡器之間同步檢查的時間間隔，單位是秒
    authentication {             #設定驗證型別和密碼。主從必須一樣
        auth_type PASS           #設定vrrp驗證型別，主要有PASS和AH兩種
        auth_pass 1111           #設定vrrp驗證密碼，在同一個vrrp_instance下，MASTER與BACKUP必須使用相同的密碼才能正常通訊
    }
    virtual_ipaddress {          #VRRP HA 虛擬地址 如果有多個VIP，繼續換行填寫
        103.110.98.20
    }

track_script {                      #執行監控的服務。注意這個設定不能緊挨著寫在vrrp_script配置塊的後面（實驗中碰過的坑），否則nginx監控失效！！
   chk_http_port                    #引用VRRP指令碼，即在 vrrp_script 部分指定的名字。定期執行它們來改變優先順序，並最終引發主備切換。
}
}

2）slave-node負載機上的keepalived配置
[root@slave-node ~]# cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak
[root@slave-node ~]# vim /etc/keepalived/keepalived.conf

! Configuration File for keepalived     
 
global_defs {
notification_email {                 
ops@wangshibo.cn                      
tech@wangshibo.cn
}
 
notification_email_from ops@wangshibo.cn   
smtp_server 127.0.0.1                     
smtp_connect_timeout 30                  
router_id slave-node                     
}
 
vrrp_script chk_http_port {          
    script "/opt/chk_nginx.sh"    
    interval 2                       
    weight -5                        
    fall 2                    
    rise 1                   
}
 
vrrp_instance VI_1 {             
    state BACKUP            
    interface em1             
    mcast_src_ip 103.110.98.24   
    virtual_router_id 51         
    priority 99                
    advert_int 1                
    authentication {             
        auth_type PASS          
        auth_pass 1111           
    }
    virtual_ipaddress {         
        103.110.98.20
    }

track_script {                      
   chk_http_port                  
}

}

讓keepalived監控NginX的狀態：
1）經過前面的配置，如果master主伺服器的keepalived停止服務，slave從伺服器會自動接管VIP對外服務；
一旦主伺服器的keepalived恢復，會重新接管VIP。但這並不是我們需要的，我們需要的是當NginX停止服務的時候能夠自動切換。
2）keepalived支援配置監控指令碼，我們可以通過指令碼監控NginX的狀態，如果狀態不正常則進行一系列的操作，最終仍不能恢復NginX則殺掉keepalived，使得從伺服器能夠接管服務。

如何監控NginX的狀態
最簡單的做法是監控NginX程式，更靠譜的做法是檢查NginX埠，最靠譜的做法是檢查多個url能否獲取到頁面。

注意：這裡要提示一下keepalived.conf中vrrp_script配置區的script一般有2種寫法：
1）通過指令碼執行的返回結果，改變優先順序，keepalived繼續傳送通告訊息，backup比較優先順序再決定。這是直接監控Nginx程式的方式。
2）指令碼里面檢測到異常，直接關閉keepalived程式，backup機器接收不到advertisement會搶佔IP。這是檢查NginX埠的方式。
上文script配置部分，"killall -0 nginx"屬於第1種情況，"/opt/chk_nginx.sh" 屬於第2種情況。個人更傾向於通過shell指令碼判斷，但有異常時exit 1，正常退出exit 0，然後keepalived根據動態調整的 vrrp_instance 優先順序選舉決定是否搶佔VIP：
如果指令碼執行結果為0，並且weight配置的值大於0，則優先順序相應的增加
如果指令碼執行結果非0，並且weight配置的值小於0，則優先順序相應的減少
其他情況，原本配置的優先順序不變，即配置檔案中priority對應的值。

提示：
優先順序不會不斷的提高或者降低
可以編寫多個檢測指令碼併為每個檢測指令碼設定不同的weight（在配置中列出就行）
不管提高優先順序還是降低優先順序，最終優先順序的範圍是在[1,254]，不會出現優先順序小於等於0或者優先順序大於等於255的情況
在MASTER節點的 vrrp_instance 中配置 nopreempt ，當它異常恢復後，即使它 prio 更高也不會搶佔，這樣可以避免正常情況下做無謂的切換
以上可以做到利用指令碼檢測業務程式的狀態，並動態調整優先順序從而實現主備切換。

另外：在預設的keepalive.conf裡面還有 virtual_server,real_server 這樣的配置，我們這用不到，它是為lvs準備的。

如何嘗試恢復服務
由於keepalived只檢測本機和他機keepalived是否正常並實現VIP的漂移，而如果本機nginx出現故障不會則不會漂移VIP。
所以編寫指令碼來判斷本機nginx是否正常，如果發現NginX不正常，重啟之。等待3秒再次校驗，仍然失敗則不再嘗試，關閉keepalived，其他主機此時會接管VIP；

根據上述策略很容易寫出監控指令碼。此指令碼必須在keepalived服務執行的前提下才有效！如果在keepalived服務先關閉的情況下，那麼nginx服務關閉後就不能實現自啟動了。
該指令碼檢測ngnix的執行狀態，並在nginx程式不存在時嘗試重新啟動ngnix，如果啟動失敗則停止keepalived，準備讓其它機器接管。
監控指令碼如下（master和slave都要有這個監控指令碼）：
[root@master-node ~]# vim /opt/chk_nginx.sh

#!/bin/bash
counter=$(ps -C nginx --no-heading|wc -l)
if [ "${counter}" = "0" ]; then
    /usr/local/nginx/sbin/nginx
    sleep 2
    counter=$(ps -C nginx --no-heading|wc -l)
    if [ "${counter}" = "0" ]; then
        /etc/init.d/keepalived stop
    fi
fi

[root@master-node ~]# chmod 755 /opt/chk_nginx.sh
[root@master-node ~]# sh /opt/chk_nginx.sh
80/tcp open http

此架構需考慮的問題
1）master沒掛，則master佔有vip且nginx執行在master上
2）master掛了，則slave搶佔vip且在slave上執行nginx服務
3）如果master上的nginx服務掛了，則nginx會自動重啟，重啟失敗後會自動關閉keepalived，這樣vip資源也會轉移到slave上。
4）檢測後端伺服器的健康狀態
5）master和slave兩邊都開啟nginx服務，無論master還是slave，當其中的一個keepalived服務停止後，vip都會漂移到keepalived服務還在的節點上；
如果要想使nginx服務掛了，vip也漂移到另一個節點，則必須用指令碼或者在配置檔案裡面用shell命令來控制。（nginx服務宕停後會自動啟動，啟動失敗後會強制關閉keepalived，從而致使vip資源漂移到另一臺機器上）

最後驗證（將配置的後端應用域名都解析到VIP地址上）：關閉主伺服器上的keepalived或nginx，vip都會自動飄到從伺服器上。
驗證keepalived服務故障情況：
1）先後在master、slave伺服器上啟動nginx和keepalived，保證這兩個服務都正常開啟:
[root@master-node ~]# /usr/local/nginx/sbin/nginx
[root@master-node ~]# /etc/init.d/keepalived start
[root@slave-node ~]# /usr/local/nginx/sbin/nginx
[root@slave-node ~]# /etc/init.d/keepalived start
2）在主伺服器上檢視是否已經繫結了虛擬IP：
[root@master-node ~]# ip addr
.......
2: em1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
link/ether 44:a8:42:17:3d:dd brd ff:ff:ff:ff:ff:ff
inet 103.110.98.14/26 brd 103.10.86.63 scope global em1
valid_lft forever preferred_lft forever
inet 103.110.98.20/32 scope global em1
valid_lft forever preferred_lft forever
inet 103.110.98.20/26 brd 103.10.86.63 scope global secondary em1:0
valid_lft forever preferred_lft forever
inet6 fe80::46a8:42ff:fe17:3ddd/64 scope link
valid_lft forever preferred_lft forever
......
3）停止主伺服器上的keepalived:
[root@master-node ~]# /etc/init.d/keepalived stop
Stopping keepalived (via systemctl): [ OK ]
[root@master-node ~]# /etc/init.d/keepalived status
[root@master-node ~]# ps -ef|grep keepalived
root 26952 24348 0 17:49 pts/0 00:00:00 grep --color=auto keepalived
[root@master-node ~]#
4）然後在從伺服器上檢視，發現已經接管了VIP：
[root@slave-node ~]# ip addr
.......
2: em1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
link/ether 44:a8:42:17:3c:a5 brd ff:ff:ff:ff:ff:ff
inet 103.110.98.24/26 brd 103.10.86.63 scope global em1
inet 103.110.98.20/32 scope global em1
inet6 fe80::46a8:42ff:fe17:3ca5/64 scope link
valid_lft forever preferred_lft forever
.......
發現master的keepalived服務掛了後，vip資源自動漂移到slave上，並且網站正常訪問，絲毫沒有受到影響！
5）重新啟動主伺服器上的keepalived，發現主伺服器又重新接管了VIP，此時slave機器上的VIP已經不在了。
[root@master-node ~]# /etc/init.d/keepalived start
Starting keepalived (via systemctl): [ OK ]
[root@master-node ~]# ip addr
.......
2: em1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
link/ether 44:a8:42:17:3d:dd brd ff:ff:ff:ff:ff:ff
inet 103.110.98.14/26 brd 103.10.86.63 scope global em1
valid_lft forever preferred_lft forever
inet 103.110.98.20/32 scope global em1
valid_lft forever preferred_lft forever
inet 103.110.98.20/26 brd 103.10.86.63 scope global secondary em1:0
valid_lft forever preferred_lft forever
inet6 fe80::46a8:42ff:fe17:3ddd/64 scope link
valid_lft forever preferred_lft forever
......

[root@slave-node ~]# ip addr
.......
2: em1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP qlen 1000
link/ether 44:a8:42:17:3c:a5 brd ff:ff:ff:ff:ff:ff
inet 103.110.98.24/26 brd 103.10.86.63 scope global em1
inet6 fe80::46a8:42ff:fe17:3ca5/64 scope link
valid_lft forever preferred_lft forever

接著驗證下nginx服務故障，看看keepalived監控nginx狀態的指令碼是否正常？
如下：手動關閉master機器上的nginx服務，最多2秒鐘後就會自動起來（因為keepalive監控nginx狀態的指令碼執行間隔時間為2秒）。域名訪問幾乎不受影響！
[root@master-node ~]# /usr/local/nginx/sbin/nginx -s stop
[root@master-node ~]# ps -ef|grep nginx
root 28401 24826 0 19:43 pts/1 00:00:00 grep --color=auto nginx
[root@master-node ~]# ps -ef|grep nginx
root 28871 28870 0 19:47 ? 00:00:00 /bin/sh /opt/chk_nginx.sh
root 28875 24826 0 19:47 pts/1 00:00:00 grep --color=auto nginx
[root@master-node ~]# ps -ef|grep nginx
root 28408 1 0 19:43 ? 00:00:00 nginx: master process /usr/local/nginx/sbin/nginx
www 28410 28408 0 19:43 ? 00:00:00 nginx: worker process
www 28411 28408 0 19:43 ? 00:00:00 nginx: worker process
www 28412 28408 0 19:43 ? 00:00:00 nginx: worker process
www 28413 28408 0 19:43 ? 00:00:00 nginx: worker process

最後可以檢視兩臺伺服器上的/var/log/messages，觀察VRRP日誌資訊的vip漂移情況~~~~

-------------------------------------------------------------------------------------------------------------------------------------------------
可能出現的問題：
1）VIP繫結失敗
原因可能有：
-> iptables開啟後，沒有開放允許VRRP協議通訊的策略（也有可能導致腦裂）；可以選擇關閉iptables
-> keepalived.conf檔案配置有誤導致，比如interface繫結的裝置錯誤

2）VIP繫結後，外部ping不通
可能的原因是：
-> 網路故障，可以檢查下閘道器是否正常；
-> 閘道器的arp快取導致，可以進行arp更新，命令是"arping -I 網路卡名 -c 5 -s VIP 閘道器"

MySQL 主從複製，雙機熱備
2019-04-02
MySql
防火牆的雙機熱備1：主備、負載方式
2021-04-29
防火牆負載
9、雙機熱備
2024-09-27
rocketMq之雙主雙從同步模式搭建
2020-12-07
MQ模式
HCIE Security 雙機熱備備考筆記（幕布）
2020-10-29
筆記
Keepalived雙機熱備實現高可用
2020-12-29
Keepalived - Keepalived 實現 tomcat雙機熱備
2020-12-30
Tomcat
怎麼在linux完成MySQL主從熱備？
2020-01-15
LinuxMySql
MySQL雙機互備熱備自動切換KV
2022-03-21
MySql
兩臺Linux完美實現雙機熱備
2020-12-18
Linux
MySQL雙主雙從配置
2022-05-07
MySql
新雙機熱備軟體排名看這裡！
2022-11-14
SQL Server 2008 R2雙機熱備方案
2021-03-18
SQLServer
計算機網路之策略路由與雙機熱備
2023-11-21
計算機網路路由
面試官：你知道雙機儲存有哪幾種嗎？分別有哪些優缺點(主備、主從、主主)
2019-05-04
面試
SANGFOR NGAF雙機主備專線故障的排查
2019-12-26
生產環境部署Nginx伺服器雙機熱備部署-keepalived（多種模式教程）
2024-06-30
Nginx伺服器模式
mysql雙主雙從搭建配置
2020-12-28
MySql
雙機熱備與資料備份的關係說明一二
2022-11-24
伺服器雙機熱備軟體是什麼？
2023-02-02
伺服器
什麼是雙機熱備？實現方式有哪些？
2022-11-11
使用Keepalived實現Nginx的雙機主備高可用
2021-09-06
Nginx
RocketMQ雙主雙從叢集搭建
2020-09-24
MQ
Mysql實現主從複製（一主雙從）
2018-07-17
MySql
redis主從備份
2024-09-09
Redis
使用Keepalived實現Nginx的自動重啟及雙主熱備高可用
2021-09-08
Nginx
部分雙機熱備軟體詳細介紹-行雲管家
2022-12-19
雙機熱備與叢集的區別分析-行雲管家
2022-11-22
恆訊科技推薦：Windows與Linux雙機熱備軟體
2020-10-16
WindowsLinux
Redis主從模式部署
2024-06-16
Redis模式
RocketMQ4.7.1雙主雙從叢集搭建
2020-10-30
MQ
Mycat 雙主雙從-負載均衡-高可用
2020-12-28
負載
Centos Mysql 主從備份
2024-05-18
CentOSMySql
mysql主從和主備的區別
2024-07-24
MySql
docker Redis單機主從哨兵模式切換失敗
2020-11-01
DockerRedis模式
冗餘是什麼意思？與雙機熱備有什麼區別？
2023-02-07
SQL Server雙機熱備之釋出、訂閱實現實時同步
2020-11-03
SQLServer
企業實施伺服器雙機熱備方案存在重要意義
2021-07-12
伺服器
MySql雙主一從服務搭建
2020-10-28
MySql

Nginx+keepalived 雙機熱備（主從模式）

相關文章