談談VIP漂移那點破事薦

ylw6006發表於2013-10-23

一直以來都是用nginx的upstream模組做網站最前端的負載均衡，為了防止nginx本身當機導致網站不能訪問，通常都會做兩套nginx反向代理，然後用keepalive之類的軟體提供VIP。

常見的環境是nginx主節點和從節點各有一個公網IP，一個私有IP，VIP地址也使用公網IP來提供，正常情況下VIP只會在nginx主節點上工作，只有主節點當機或者網路不可達等情況下，VIP才會漂移到nginx從節點上。如果keepalive配置了非搶佔模式，則主節點恢復後，VIP也不會漂移會主節點，而是繼續在從節工作。這種配置要求機房網路不做mac地址繫結。

最近做的兩套培訓系統測試情況如下:

系統一：主從節點做雙網路卡繫結，都只有一個私有IP，VIP也為私有IP，通過防火牆的NAT轉發使用者的訪問請求。主節點當機後，VIP可以漂移至從節點，但使用者無法訪問網站，telnet防火牆公網IP的80埠提示無法連線。

系統二：主從節點各有兩張網路卡，分別配置一個公網IP和一個私有IP。VIP地址也使用公網IP來提供。

主節點當機後，VIP可以漂移至從節點，但使用者無法ping通VIP，自然網站也就打不開。

於是分別對這兩種情況進行排查：

系統二：屬於比較常見的配置方案。VIP漂移後無法ping通，第一反應詢問機房工作人員，是否相應的裝置做了mac地址繫結。得知無繫結策略後繼續排查。

發現配置net.ipv4.ip_nonlocal_bind = 1 引數並使其生效後重新測試正常。

系統一：情況有點特殊，按系統二的解決方法嘗試無果後，懷疑埠路由器對映上出現問題。於是繼續測試VIP漂移，發現VIP漂移到從節點後，防火牆上的arp表中vip對應的mac地址依舊是主節點網路卡的mac地址，原來防火牆才是罪魁禍首，坑爹的貨。機房使用的防火牆型號華為Quidway Eudemon1000E，據說預設配置下，這個arp地址表自動重新整理需要20分鐘！

好吧！於是用下面的命名手工重新整理後，萬事大吉，網站訪問也很順暢，比較鬱悶的是當主節點重新搶佔VIP後，依然需要手工重新整理下，否則防火牆還是把請求轉給從節點響應。

# arping -I 網路卡地址 -c 3 -s VIP地址閘道器地址

後記：

要徹底解決系統一的問題，可以從兩方面去著手，首先是考慮去調整防火牆的arp表的自動重新整理時間；其次是考慮在從節點上部署一個無限迴圈的指令碼，時時去檢測是否搶佔到了VIP，若搶佔成功，則執行前面的重新整理命令，命令成功執行後退出指令碼，同時可以用nagios監控該指令碼，瞭解最新的主從切換情況。切記，迴圈執行一次接受後sleep 1秒，否則會當機的哦！

如果在主節點上也部署類似的指令碼，則會對網路帶來負擔，因而主節點恢復後的重新整理手工執行下就好了，如果忘記執行了，從節點依然可以工作，無傷大雅！

談談JavaScript this那點事
2017-09-29
JavaScript
談談CORS那點事
2017-09-25
CORS
談談Promise那點事(一)
2017-09-23
Promise
談談Promise那點事(二)
2017-09-24
Promise
談談 ajax 工作過程那點事
2017-10-14
談談遊戲資料分析的那點事
2019-12-12
遊戲
談談 js 去重方法的那點事
2017-10-08
JS
談談 js判斷陣列那點事
2017-10-09
JS陣列
談談 js 深淺拷貝那點事(一)
2017-10-12
JS
談談 js 深淺拷貝那點事(二)
2017-10-12
JS
淺談 Java HashMap 的那點事
2015-09-01
JavaHashMap
求職那點破事兒
2018-03-30
求職
讀書那點事——淺談2015，暢談2016
2015-12-25
淺談HTTP快取與CDN快取的那點事
2022-11-15
HTTP快取
郵件的那點事薦
2011-03-19
Session、Cookie、Token 【淺談三者之間的那點事】
2020-09-22
SessionCookie
推薦系統的那點事
2014-08-25
keepalived（二）vip漂移
2018-09-14
MHA高可用+VIP漂移
2024-03-29
填個坑！再談執行緒池動態調整那點事。
2021-10-25
執行緒
oracle rac vip 漂移過程
2010-07-21
Oracle
10.2.0.3 VIP 漂移問題
2009-10-15
談談Java事務
2021-07-14
Java
談談“實戰”薦
2009-05-13
談談安全軟體薦
2010-11-03
rac 手動漂移scan ip vip
2017-12-20
《推薦系統學習》之推薦系統那點事
2016-04-17
談談對分散式事務的一點理解和解決方案
2020-07-07
分散式
談談jQuery中Ajax那些事
2018-09-14
jQuery
談談javascript非同步哪些事
2018-06-16
JavaScript非同步
RAC_網路_VIP漂移_SCAN IP
2016-07-04
談談 Java 中的那些“瑣”事
2020-09-22
Java
Java synchronized那點事
2022-05-18
Javasynchronized
前端加密那點事
2019-01-21
前端加密
佈局那點事
2018-11-20
面試那點事兒
2018-03-13
面試
linux start_udev 導致VIP漂移
2018-07-09
Linuxdev
Oracle 10g RAC vip 漂移問題
2008-01-15
Oracle 10g

談談VIP漂移那點破事薦

相關文章