mysql mha 主從自動切換高可用

zping發表於2016-03-16

mha（Master High Availability）目前在MySQL多伺服器（超過二臺），高可用方面是一個相對成熟的解決方案。

一，什麼是mha，有什麼特性

1. 主伺服器的自動監控和故障轉移

MHA監控複製架構的主伺服器，一旦檢測到主伺服器故障，就會自動進行故障轉移。即使有些從伺服器沒有收到最新的relay log，MHA自動從最新的從伺服器上識別差異的relay log並把這些日誌應用到其他從伺服器上，因此所有的從伺服器保持一致性了。MHA通常在幾秒內完成故障轉移，9-12秒可以檢測出主伺服器故障，7-10秒內關閉故障的主伺服器以避免腦裂，幾秒中內應用差異的relay log到新的主伺服器上，整個過程可以在10-30s內完成。還可以設定優先順序指定其中的一臺slave作為master的候選人。由於MHA在slaves之間修復一致性，因此可以將任何slave變成新的master，而不會發生一致性的問題，從而導致複製失敗。

2. 互動式主伺服器故障轉移

可以只使用MHA的故障轉移，而不用於監控主伺服器，當主伺服器故障時，人工呼叫MHA來進行故障故障。

3. 非互動式的主故障轉移

不監控主伺服器，但自動實現故障轉移。這種特徵適用於已經使用其他軟體來監控主伺服器狀態，比如heartbeat來檢測主伺服器故障和虛擬IP地址接管，可以使用MHA來實現故障轉移和slave伺服器晉級為master伺服器。

4. 線上切換主從伺服器

在許多情況下，需要將現有的主伺服器遷移到另外一臺伺服器上。比如主伺服器硬體故障，RAID控制卡需要重建，將主伺服器移到效能更好的伺服器上等等。維護主伺服器引起效能下降，導致停機時間至少無法寫入資料。另外，阻塞或殺掉當前執行的會話會導致主主之間資料不一致的問題發生。MHA提供快速切換和優雅的阻塞寫入，這個切換過程只需要0.5-2s的時間，這段時間內資料是無法寫入的。在很多情況下，0.5-2s的阻塞寫入是可以接受的。因此切換主伺服器不需要計劃分配維護時間視窗(呵呵，不需要你在夜黑風高時通宵達旦完成切換主伺服器的任務)。

5.MHA由兩部分組成：MHA Manager（管理節點）和MHA Node（資料節點）

要搭建MHA,要求一個複製叢集中必須最少有三臺資料庫伺服器，一主二從，即一臺充當master，一臺充當備用master，另外一臺充當從庫，管理節點可以和master在一臺機器上。所以如果你只有二臺機器的話，heartbeat,keepalive等都是不錯的選擇了。

6.MHA比較靈活，可以寫指令碼，來進行故障轉移，或者主從切換等。

7.mha出現故障後，配置檔案會被修改掉，這一點，讓我覺得很搞笑，如果故障轉移需要重新修改配置檔案，重新啟動masterha_manager服務.

二，伺服器說明

檢視複製列印 ?

192.168.10.103 masters //主
192.168.10.209 slave1 //從
192.168.10.219 slave2 //從（主備）
192.168.10.220 manage //管理節點

一主二從，一個管理節點，將上面的內容寫入到每臺/etc/hosts當中

三，伺服器間，無密碼ssh登入

檢視複製列印 ?

# ssh-keygen -t rsa
# ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.10.103
# ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.10.209
# ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.10.219
# ssh-copy-id -i /root/.ssh/id_rsa.pub root@192.168.10.220

上面有5個命令，如果在103機器上，103本身不需要執行ssh-copy-id。copy完了以後，ssh測試一下，機器間切換是不是需要密碼了。

四，安裝mha

1,下載mha

https://code.google.com/p/mysql-master-ha/downloads/list

2,所有節點都要安裝

# yum install -y perl-DBD-MySQL
# rpm -ivh mha4mysql-node-0.54-0.el6.noarch.rpm

3,管理節點

# yum install -y perl-DBD-MySQL perl-Config-Tiny perl-Log-Dispatch perl-Parallel-ForkManager
# rpm -ivh mha4mysql-manager-0.55-0.el6.noarch.rpm

注意：manager和node節點的版本可以不一樣

五，配置mysql replication

請參考：mysql replication 主從(master-slave)同步

要符合mha的配置，根這篇文章有點不同。

1，主從的配置都要有

檢視複製列印 ?

binlog-do-db=test
replicate-do-db=test

一般情況下，主伺服器需要包含binlog-do-db=test，從伺服器需要包含replicate-do-db=test，這樣主從就可以同步了。但是隻是這樣配置的話，會報以下錯誤

All log-bin enabled servers must have same binlog filtering rules (same binlog-do-db and binlog-ignore-db). Check SHOW MASTER STATUS output and set my.cnf correctly.

在摸索這一塊配置的時候，浪費很多時間，我一直以為，上面英文的意思是說，主從同步的資料庫要一樣，其實不是，而是配置檔案中，配置資料庫這一塊要一樣。

2，從伺服器，要加上relay_log_purge=0，不加的話，會報出warning,relay_log_purge=0 is not set on slave

六，corosync pacemaker mysql replication配置

請參考：corosync pacemaker mysql replication 實現高可用

配置corosync pacemaker的目的，其實就是為得到一個虛擬IP，連主和主備中的一個，我可以通過虛擬IP連線，這樣做的好處就是，如果主down機了，我通過虛擬IP可以連線主備，如果主修改好了，那麼虛擬IP可以連線到主，而不需要去修改程式碼。

七，配置mha manage

1，新增管理賬號，每臺機器都執行以下操作

檢視複製列印 ?

grant all privileges on *.* TO mha@'192.168.%' IDENTIFIED BY 'test';
flush privileges;

2，配置/etc/mha/app1.cnf，只在管理端做，manage這臺機器

檢視複製列印 ?

# mkdir /etc/mha
# mkdir -p /var/log/mha/app1
[root@manage mysql]# cat /etc/mha/app1.cnf
[server default]
manager_log=/var/log/mha/app1/manager.log
manager_workdir=/var/log/mha/app1.log
master_binlog_dir=/var/lib/mysql
user=mha
password=test
ping_interval=2
repl_password=test
repl_user=test
ssh_user=root
[server1]
hostname=192.168.10.103
port=3306
[server2]
candidate_master=1
check_repl_delay=0
hostname=192.168.10.219
port=3306
[server3]
hostname=192.168.10.209
port=3306

在server default中的配置，是三臺機器共同的配置，也可以放到具體的server中進行定製

八，檢查mha manage是不是配置成功

1,檢查ssh登入

# masterha_check_ssh --conf=/etc/mha/app1.cnf

如果看到，All SSH connection tests passed successfully，就說明ssh配置成功了

2,檢查mysql replication是否配置成功

# masterha_check_repl --conf=/etc/mha/app1.cnf

如果，出現以下內容，說明配置成功了。

mha 檢驗 mysql replication

3,管理端常用命令

masterha_check_ssh 檢查MHA的SSH配置狀況
masterha_check_repl 檢查MySQL複製狀況
masterha_manger 啟動MHA
masterha_check_status 檢測當前MHA執行狀態
masterha_master_monitor 檢測master是否當機
masterha_master_switch 控制故障轉移（自動或者手動）
masterha_conf_host 新增或刪除配置的server資訊

九，在管理端，啟動監控

檢視複製列印 ?

[root@manage mha]# nohup masterha_manager --conf=/etc/mha/app1.cnf > /tmp/mha_manager.log 2>&1 & //開啟MHA
[root@manage mha]# masterha_check_status --conf=/etc/mha/app1.cnf //檢視狀態 app1 (pid:13675) is running(0:PING_OK), master:192.168.10.103 //說明已經啟用
[root@manage mha]# masterha_stop --conf=/etc/mha/app1.cnf //關閉監控

到這兒，mha我們就配置好了。

十，說一下，我的測試過程

1,mysql -u test -p -h 192.168.10.130，通過虛擬IP登入

2,插入資料，檢視一下主103有沒有該資料，以及二個從伺服器，是不是同步了資料。

3,在主103上，執行crm node standby,會帶來幾種結果。

在220機器上，/etc/mha/app1.cnf

[server1]
hostname=192.168.10.103
port=3306

這段配置消失了。

在219機器上，show master status;是有資料的，變成主機了

在209機器上，show slave status\G;中 Master_Host: 192.168.10.219，變成219了。

4，在103上面，執行# crm node online,這個時候，103既不是主，也不是從，standby後mysqld程式被關閉，所以在這兒要啟動mysqld，然後在將103加入到219中。

檢視複製列印 ?

mysql> CHANGE MASTER TO MASTER_HOST='192.168.10.219',
MASTER_USER='test', MASTER_PASSWORD='test',
MASTER_LOG_FILE='mysql-bin.000048',
MASTER_LOG_POS=107;

5,線上切換主從

檢視複製列印 ?

[root@manage mysql]# masterha_master_switch --conf=/etc/mha/app1.cnf --master_state=alive --new_master_host=192.168.10.103 --new_master_port=3306 --orig_master_is_new_slave --running_updates_limit=10000
Wed Apr 29 04:14:55 2015 - [info] MHA::MasterRotate version 0.55.
Wed Apr 29 04:14:55 2015 - [info] Starting online master switch..
Wed Apr 29 04:14:55 2015 - [info]
Wed Apr 29 04:14:55 2015 - [info] * Phase 1: Configuration Check Phase..
Wed Apr 29 04:14:55 2015 - [info]
Wed Apr 29 04:14:55 2015 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.
Wed Apr 29 04:14:55 2015 - [info] Reading application default configurations from /etc/mha/app1.cnf..
Wed Apr 29 04:14:55 2015 - [info] Reading server configurations from /etc/mha/app1.cnf..
Wed Apr 29 04:14:55 2015 - [info] Current Alive Master: 192.168.10.219(192.168.10.219:3306)
Wed Apr 29 04:14:55 2015 - [info] Alive Slaves:
Wed Apr 29 04:14:55 2015 - [info] 192.168.10.209(192.168.10.209:3306) Version=5.1.73-log (oldest major version between slaves) log-bin:enabled
Wed Apr 29 04:14:55 2015 - [info] Replicating from 192.168.10.219(192.168.10.219:3306)
It is better to execute FLUSH NO_WRITE_TO_BINLOG TABLES on the master before switching. Is it ok to execute on 192.168.10.219(192.168.10.219:3306)? (YES/no): yes
Wed Apr 29 04:15:10 2015 - [info] Executing FLUSH NO_WRITE_TO_BINLOG TABLES. This may take long time..
Wed Apr 29 04:15:10 2015 - [info] ok.
Wed Apr 29 04:15:10 2015 - [info] Checking MHA is not monitoring or doing failover
。。。。。。。。。。。。。省略了。。。。。。。。。。。。。。。

這樣就切換到最原始的狀態了。

MYSQL5.6主從+keepalive高可用自動切換
2019-11-13
MySql
MHA+MySQL主從配置實現MySQL高可用
2018-07-10
MySql
MHA高可用配置及故障切換
2024-06-30
MySQL高可用之MHA切換測試（switchover & failover）
2018-08-02
MySqlAI
postgresql10主從+keepalived高可用自動切換(切換關鍵在指令碼)
2019-11-29
SQL指令碼
MySQL高可用方案MHA線上切換的步驟及原理
2019-04-18
MySql
5.6 MySql主從自動切換指令碼
2016-02-29
MySql指令碼
MHA實現mysql主從資料庫手動切換的方法
2021-09-09
MySql資料庫
【MHA】mysql高可用之MHA
2015-10-29
MySql
【MySQL】【高可用】從masterha_master_switch工具簡單分析MHA的切換邏輯
2017-11-12
MySqlAST
雙機高可用、負載均衡、MySQL(讀寫分離、主從自動切換)架構設計
2016-08-06
負載MySql架構
Mysql 5.7 MHA 高可用
2022-08-23
MySql
MySQL MHA高可用方案
2017-04-26
MySql
Mysql MHA部署-06手動切換
2020-03-15
MySql
MySQL主從切換
2015-08-25
MySql
MySQL MHA部署 Part 7 MHA手動切換測試
2019-07-22
MySql
MySQL 主從切換延時高問題分析
2022-02-06
MySql
手工切換MySQL主從
2018-11-27
MySql
mysql主從搭建切換
2016-06-29
MySql
keepalived與mysql主主叢集自動切換
2015-09-17
MySql
基於 MHA 高可用的 MySQL
2019-08-26
MySql
mysql高可用架構MHA搭建
2020-09-19
MySql架構
MySQL高可用方案MHA介紹
2017-03-03
MySql
mysql MHA 高可用架構部署
2016-03-01
MySql架構
mysql for linux主從切換
2014-10-25
MySqlLinux
mysql主從複製+主備切換
2018-01-05
MySql
ostgreSQL主從切換-手動
2024-05-20
SQL
mysql MHA搭建和切換測試
2015-05-12
MySql
Dledger是如何實現主從自動切換的
2020-09-28
MySQL 實現高可用架構之 MHA
2021-07-21
MySql架構
Mysql 高可用(MHA)-讀寫分離(Atlas)
2021-02-26
MySql
MySQL高可用架構-MMM、MHA、MGR、PXC
2021-10-02
MySql架構
MySQL高可用架構之MHA實踐
2016-08-23
MySql架構
MySQL Orchestrator自動導換+VIP切換
2021-07-27
MySql
MHA高可用+VIP漂移
2024-03-29
MySQL 高可用架構 - MHA環境部署記錄
2020-12-10
MySql架構
MySQL高可用架構-MHA環境部署記錄
2016-07-12
MySql架構
Redis主從切換
2019-10-11
Redis

mysql mha 主從自動切換 高可用

相關文章

mysql mha 主從自動切換高可用