【原創】基於Keepalived做主備的MySQL在切換時遇到的問題

摩雲飛發表於2016-05-11

問題描述：
MySQL 基於 keepalived 實現主備切換，業務 A 和業務 B （其實 A 和 B 上跑的業務是相同的）同時使用 MySQL 做資料庫查詢。通過重啟 keepalived 服務來測試 MySQL 主備切換後，能夠為業務提供正常的服務。

問題現象：
測試人員發現 MySQL 主從切換之後，與業務 A 相關的 TCP 連線資訊已經變更為新 TCP 連線，而與業務 B 相關的 TCP 連線資訊仍舊未變化。

具體環境如下：
業務A：172.16.177.158
業務B：172.16.177.159

VIP：172.16.177.147
MySQL master：172.16.177.148
MySQL slave：172.16.177.149

在業務正常執行狀態下，業務A 通過 VIP 與 MySQL master（148）建立 6 條 TCP 連線（業務開發人員告知的），分別對應埠
43666、 43668、 43669、 43670、 43673、 43674。

當通過重啟 148 機器上的 keepalived 服務來完成 VIP 切換，從而達成 MySQL 主備切換時，可以看到如下抓包資訊：

如下為 158 上的 TCP 連結資訊。

可以看到，上面出現了 10 個 RST ……，呃，先不管為什麼多出來 4 個吧。

下面看一下 148 （原 MySQL master）上來自 158 的連線資訊。

從上面兩個截圖中，只能看到有兩條 TCP 鏈路上出現了新的請求，並且因為重啟了 keepalived 的原因，出現了 TCP 的重發。這兩條 TCP 鏈路對應的埠分別為： 43673、43669。
這裡重發請求的埠與 158 上的抓包中顯示的一致。

再看一下 149 （原 MySQL slave）上來自 158 的連線資訊。

可以看到這裡也出現了 10 條 TCP 鏈路被 RST 。與上面的 10 條 TCP 連結是對應的。

綜上，整個過程可以描述為：

最開始 158 與 148 建立了6條 OCS 業務的 TCP 連線；
在重啟 keepalived 的時候，恰好使用埠 43673 和 43669 的 TCP 連線正在信令互動，而此時正處於 VIP 147 從 148 向 149 漂移的過程之中，此時這兩條 TCP 鏈路上的請求會因為得不到任何回應而觸發重傳；
當 VIP 成功繫結到 149 上後，上述兩條 TCP 鏈路上的重傳請求會被 RST，而當其他 TCP 鏈路上有新的請求時，才會被 RST。被 RST 後，OSC 會重新建立 TCP 連線。

下面單獨看下每條 TCP 鏈路的狀況：

埠 43673 的 TCP 鏈路。

埠為 43669 的 TCP 鏈路。

埠為 43666 的 TCP 鏈路。

埠為 43674 的 TCP 鏈路。

埠為 43670 的 TCP 鏈路。

埠為 43668 的 TCP 鏈路。

埠為 43671 的 TCP 鏈路。

埠為 43665 的 TCP 鏈路。

埠為 43672 的 TCP 鏈路。

埠為 43667 的 TCP 鏈路。

上述現象在對於 159 上的業務來說也是這樣，不再重複說明。

總結：
上述問題的出現值得思考的地方有，通過重啟 keepalived 來促使 MySQL 主備切換這種方式對於實際應用場景是否有意義？！如果實際情況中真的出現類似於 keepalived 重啟導致的 MySQL 主從切換，那麼由此導致的主從不一致將如何解決？！業務程式通過某種保活機制觸發對當前 TCP 鏈路是否處於“半開啟”狀態的檢測時間間隔多少比較合適？MySQL 上的 wait_timeout 設定多少比較合適！？
真正讓人感到不安的是，僅通過重啟 keepalived 來進行主備切換，無論是 MySQL 側還是業務側，居然都不會收到 TCP 的 FIN 或 RST ，而只會在業務層面有“動作”時才能發現 TCP 鏈路的問題，這種現象對類似 MySQL 這種服務來說必然會造成一些問題。

mysql主備切換canal出現的問題解析
2020-11-22
MySql
DATAGUARD在做SWITCHOVER切換時遇到問題總結
2015-01-26
【原創】安裝和使用TPCC-MySQL工具遇到的問題
2016-05-11
MySql
基於keepalived Mysql雙主熱備配置
2016-11-18
MySql
MySQL 主從切換延時高問題分析
2022-02-06
MySql
Mysql+keepalived主主切換薦
2013-10-24
MySql
完美解決setInterval在瀏覽器切換時加速的問題
2019-02-28
瀏覽器
mysql 遇到的問題
2024-11-05
MySql
mysql原始碼安裝時遇到的問題
2015-03-20
MySql原始碼
在RAC 創庫時遇到PRKC-1007 的問題
2009-02-24
在釋出war包時遇到的問題
2007-08-15
mysql備份還原-基於binlog的增量備份還原
2014-11-17
MySql
關於struts開發時遇到的問題
2005-09-12
在騰訊雲上安裝mysql遇到的問題
2018-07-07
MySql
Redis+Keepalived主從熱備秒級切換
2016-05-01
Redis
關於在執行java連線MongoDB時遇到的連線超時問題
2018-11-06
JavaMongoDB
Mysql主從架構搭建的時候遇到的問題
2018-09-30
MySql架構
mysql 5.5.8 免安裝版本在windows xp 和windows 7之前切換的問題
2011-01-13
MySqlWindows
通過keepalived實現 MySQL VIP 自動切換
2015-09-28
MySql
keepalived與mysql主主叢集自動切換
2015-09-17
MySql
安裝mysql遇到的問題
2017-05-19
MySql
遇到mysql的奇怪問題了
2003-08-13
MySql
laravel 在配置nginx代理時遇到的連結問題
2020-11-27
LaravelNginx
使用 redisson 時遇到的問題
2017-07-27
Redis
nginx keepalived 主從切換
2016-05-31
Nginx
mysql 5.7+keepalived主從切換步驟簡述
2018-03-23
MySql
從資料庫裡取值時遇到的換行問題(轉)
2007-08-16
資料庫
FPGA的DAC轉換部分遇到的問題
2024-03-10
FPGA
備庫的切換狀態為SWITCHOVER PENDING時進行dataguard主備庫角色切換
2017-03-21
【MySQL】使用innobackup 2.4遇到的問題
2017-08-27
MySql
Jmeter mysql testing遇到的問題
2015-10-07
JMeterMySql
關於時間轉換 SimpleDateFormat 的使用的問題
2017-03-06
ORM
MySQL 主備庫切換記錄
2015-07-15
MySql
關於微信 H5 頁面切換 webview 的問題
2024-05-22
H5WebView
主備切換的準備工作
2016-01-19
關於MyEclipse6.0配置SSH時遇到的問題
2007-11-14
Eclipse
postgresql10主從+keepalived高可用自動切換(切換關鍵在指令碼)
2019-11-29
SQL指令碼
對於實時大庫的切換方法
2013-04-24

【原創】基於Keepalived做主備的MySQL在切換時遇到的問題

相關文章