MySQL 高可用架構 - MHA環境部署記錄
MySQL 高可用架構 - MHA環境部署記錄
一、MHA介紹
MHA(Master High Availability)目前在MySQL高可用方面是一個相對成熟的解決方案,它由日本DeNA公司youshimaton(現就職於Facebook公司)開發,是日本的一位MySQL專家採用Perl語言編寫的一個指令碼管理工具,該工具僅適用於MySQLReplication(二層)環境,目的在於維持Master主庫的高可用性。是一套優秀的作為MySQL高可用性環境下故障切換和主從提升的高可用軟體。在MySQL故障切換過程中,MHA能做到在0~30秒之內自動完成資料庫的故障切換操作,並且在進行故障切換的過程中,MHA能在最大程度上保證資料的一致性,以達到真正意義上的高可用。
MHA是自動的master故障轉移和Slave提升的軟體包.它是基於標準的MySQL複製(非同步/半同步).該軟體由兩部分組成:MHA Manager(管理節點)和MHA Node(資料節點)。
1. MHA Manager可以單獨部署在一臺獨立的機器上管理多個master-slave叢集,也可以部署在一臺slave節點上。MHA Manager會定時探測叢集中的node節點,當發現master出現故障的時候,它可以自動將具有最新資料的slave提升為新的master,然後將所有其它的slave導向新的master上.整個故障轉移過程對應用程式是透明的。
2. MHA Node執行在每臺MySQL伺服器上,它通過監控具備解析和清理logs功能的指令碼來加快故障轉移的。
在MHA自動故障切換過程中,MHA試圖從當機的主伺服器上儲存二進位制日誌,最大程度的保證資料的不丟失,但這並不總是可行的。例如,如果主伺服器硬體故障或無法通過ssh訪問,MHA沒法儲存二進位制日誌,只進行故障轉移而丟失了最新的資料。使用MySQL 5.5的半同步複製,可以大大降低資料丟失的風險。MHA可以與半同步複製結合起來。如果只有一個slave已經收到了最新的二進位制日誌,MHA可以將最新的二進位制日誌應用於其他所有的slave伺服器上,因此可以保證所有節點的資料一致性。
目前MHA主要支援一主多從的架構,要搭建MHA,要求一個複製叢集中必須最少有三臺資料庫伺服器,一主二從,即一臺充當master,一臺充當備用master,另外一臺充當從庫,因為至少需要三臺伺服器,出於機器成本的考慮,淘寶也在該基礎上進行了改造,目前淘寶TMHA已經支援一主一從。
二、MHA工作架構說明
展示瞭如何通過MHA Manager管理多組主從複製。可以將MHA工作原理總結為如下:
相較於其它HA軟體,MHA的目的在於維持MySQL Replication中Master庫的高可用性,其最大特點是可以修復多個Slave之間的差異日誌,最終使所有Slave保持資料一致,然後從中選擇一個充當新的Master,並將其它Slave指向它。工作流程主要如下:
1. 從當機崩潰的master儲存二進位制日誌事件(binlog events);
2. 識別含有最新更新的slave;
3. 應用差異的中繼日誌(relay log)到其他的slave;
4. 應用從master儲存的二進位制日誌事件(binlog events);
5. 提升一個slave為新的master;
6. 使其他的slave連線新的master進行復制;
################ MHA工作原理 ###############
當master出現故障時,通過對比slave之間I/O執行緒讀取master binlog的位置,選取最接近的slave做為latest slave。其它slave通過與latest slave對比生成差異中繼日誌。在latest slave上應用從master儲存的binlog,同時將latest slave提升為master。最後在其它slave上應用相應的差異中繼日誌並開始從新的master開始複製。
在MHA實現Master故障切換過程中,MHA Node會試圖訪問故障的master(通過SSH),如果可以訪問(不是硬體故障,比如InnoDB資料檔案損壞等),會儲存二進位制檔案,以最大程度保證資料不丟失。MHA和半同步複製一起使用會大大降低資料丟失的危險。
############ MHA軟體的架構 ########### 由兩部分組成,Manager工具包 和 Node工具包,具體的說明如下。
1. Manager工具包主要包括以下幾個工具:
masterha_check_ssh # 檢查MHA的SSH配置狀況
masterha_check_repl # 檢查MySQL複製狀況
masterha_manger # 啟動MHA
masterha_check_status # 檢測當前MHA執行狀態
masterha_master_monitor # 檢測master是否當機
masterha_master_switch # 控制故障轉移(自動或者手動)
masterha_conf_host # 新增或刪除配置的server資訊
2. Node工具包(這些工具通常由MHA Manager的指令碼觸發,無需人為操作)主要包括以下幾個工具:
save_binary_logs #(儲存二進位制日誌) 儲存和複製master的二進位制日誌
apply_diff_relay_logs # (應用差異中繼日誌) 識別差異的中繼日誌事件並將其差異的事件應用於其他的slave
filter_mysqlbinlog # 去除不必要的ROLLBACK事件(MHA已不再使用這個工具)
purge_relay_logs # (清理中繼日誌) 清除中繼日誌(不會阻塞SQL執行緒)
########## MHA如何保持資料的一致性呢?######### 主要通過MHA node的以下幾個工具實現,但是這些工具由mha manager觸發:
save_binary_logs 如果master的二進位制日誌可以存取的話,儲存複製master的二進位制日誌,最大程度保證資料不丟失
apply_diff_relay_logs 相對於最新的slave,生成差異的中繼日誌並將所有差異事件應用到其他所有的slave
注意:
對比的是relay log,relay log越新就越接近於master,才能保證資料是最新的。
purge_relay_logs刪除中繼日誌而不阻塞sql執行緒
################# MHA的優勢 ##################
1. 故障切換快
在主從複製叢集中,只要從庫在複製上沒有延遲,MHA通常可以在數秒內實現故障切換。9-10秒內檢查到master故障,可以選擇在7-10秒關閉master以避免出現裂腦,幾秒鐘內,將差異中繼日誌(relay log)應用到新的master上,因此總的當機時間通常為10-30秒。恢復新的master後,MHA並行的恢復其餘的slave。即使在有數萬臺slave,也不會影響master的恢復時間。
DeNA在超過150個MySQL(主要5.0/5.1版本)主從環境下使用了MHA。當mater故障後,MHA在4秒內就完成了故障切換。在傳統的主動/被動叢集解決方案中,4秒內完成故障切換是不可能的。
2. master故障不會導致資料不一致
當目前的master出現故障時,MHA自動識別slave之間中繼日誌(relay log)的不同,並應用到所有的slave中。這樣所有的salve能夠保持同步,只要所有的slave處於存活狀態。和Semi-Synchronous Replication一起使用,(幾乎)可以保證沒有資料丟失。
3. 無需修改當前的MySQL設定
MHA的設計的重要原則之一就是儘可能地簡單易用。MHA工作在傳統的MySQL版本5.0和之後版本的主從複製環境中。和其它高可用解決方法比,MHA並不需要改變MySQL的部署環境。MHA適用於非同步和半同步的主從複製。
啟動/停止/升級/降級/安裝/解除安裝MHA不需要改變(包擴啟動/停止)MySQL複製。當需要升級MHA到新的版本,不需要停止MySQL,僅僅替換到新版本的MHA,然後重啟MHA Manager就好了。
MHA執行在MySQL 5.0開始的原生版本上。一些其它的MySQL高可用解決方案需要特定的版本(比如MySQL叢集、帶全域性事務ID的MySQL等等),但並不僅僅為了master的高可用才遷移應用的。在大多數情況下,已經部署了比較舊MySQL應用,並且不想僅僅為了實現Master的高可用,花太多的時間遷移到不同的儲存引擎或更新的前沿發行版。MHA工作的包括5.0/5.1/5.5的原生版本的MySQL上,所以並不需要遷移。
4. 無需增加大量的伺服器
MHA由MHA Manager和MHA Node組成。MHA Node執行在需要故障切換/恢復的MySQL伺服器上,因此並不需要額外增加伺服器。MHA Manager執行在特定的伺服器上,因此需要增加一臺(實現高可用需要2臺),但是MHA Manager可以監控大量(甚至上百臺)單獨的master,因此,並不需要增加大量的伺服器。即使在一臺slave上執行MHA Manager也是可以的。綜上,實現MHA並沒用額外增加大量的服務。
5. 無效能下降
MHA適用與非同步或半同步的MySQL複製。監控master時,MHA僅僅是每隔幾秒(預設是3秒)傳送一個ping包,並不傳送重查詢。可以得到像原生MySQL複製一樣快的效能。
6. 適用於任何儲存引擎
MHA可以執行在只要MySQL複製執行的儲存引擎上,並不僅限制於InnoDB,即使在不易遷移的傳統的MyISAM引擎環境,一樣可以使用MHA。
三、MHA高可用環境部署記錄
1. 機器環境
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 |
|
2. 實現主機名hostname登入(在三臺節點上都需要執行)(這一步不是必須要操作的)
1 2 3 4 5 6 7 8 9 |
|
3. 準備好Mysql主從環境
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 |
|
4. 建立使用者mha管理的賬號(在三臺節點上都需要執行)
1 2 3 4 5 6 7 8 9 10 11 12 |
|
5. 開始安裝mha
mha包括manager節點和data節點,其中:
data節點包括原有的MySQL複製結構中的主機,至少3臺,即1主2從,當master failover後,還能保證主從結構;只需安裝node包。
manager server:執行監控指令碼,負責monitoring 和 auto-failover;需要安裝node包和manager包。
5.1 在所有data資料節點機上安裝安裝MHA node
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 |
|
5.2 在manager節點(即182.48.115.238)上安裝MHA Manager(注意manager節點也要安裝MHA node)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 |
|
5.3 在管理節點(182.48.115.238)上進行下面配置
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 |
|
5.4 設定relay log的清除方式(在兩臺slave節點上)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 |
|
5.5 檢查SSH配置
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
|
5.6 使用mha工具check檢查repl環境
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 |
|
6. 管理mha操作
6.1 檢查MHA Manager的狀態
1 2 3 4 5 |
|
6.2 開啟MHA Manager監控
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 |
|
6.3 關閉MHA Manage監控
1 2 3 4 5 6 7 8 9 |
|
7. 配置VIP
vip配置可以採用兩種方式,一種通過keepalived的方式管理虛擬ip浮動;另外一種通過指令碼方式啟動虛擬ip的方式(即不需要keepalived或者heartbeat類似的軟體)。
第一種方式:通過keepalive的方式管理vip
1. 下載軟體進行並進行安裝(在兩臺master上都要安裝,準確的說一臺是master(182.48.115.236);另外一臺是備選master(182.48.115.237),在沒有切換以前是slave)
1 2 3 4 5 6 7 8 9 10 11 12 |
|
2. keepalived配置
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 |
|
3. 啟動keepalived服務
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 |
|
4. MHA引入keepalived(MySQL服務程式掛掉時通過MHA 停止keepalived)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 |
|
第二種方式:通過指令碼的方式管理VIP
這裡是修改/usr/local/bin/master_ip_failover,修改完成後內容如下。還需要手動在master伺服器上繫結一個vip
1. 現在master節點上繫結vip
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
|
2. manager節點修改/usr/local/bin/master_ip_failover
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 |
|
8. failover故障切換
1. 自動切換(必須先啟動MHA Manager,否則無法自動切換。(當然手動切換不需要開啟MHA Manager監控))
1 2 3 4 5 |
|
1.1 在candicate master(182.48.115.237)上停掉slave sql執行緒,模擬主從延時。
1 2 3 4 |
|
1.2 模擬sysbench壓力測試
1 2 |
|
1.3 開啟在candicate master(182.48.115.237)上的IO執行緒,追趕落後於master的binlog
1 2 |
|
1.4 殺掉主庫(182.48.115.236)mysql程式,模擬主庫發生故障,進行自動failover操作
1 |
|
1.5 檢視MHA切換日誌,瞭解整個切換過程。在manager管理節點(182.48.115.238)上檢視日誌
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 |
|
2. 手動Failover(MHA Manager必須沒有執行)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 |
|
9. 線上進行切換
|
|
由於線上進行切換需要呼叫到master_ip_online_change這個指令碼,但是由於該指令碼不完整,需要自己進行相應的修改。在測試中發現指令碼還是有問題,指令碼中new_master_password這個變數獲取不到,導致線上切換失敗,所以進行了相關的硬編碼,直接把mysql的root使用者密碼賦值給變數new_master_password。另外這個指令碼還可以管理vip。
10. 修復當機後的master節點
通常情況下自動切換以後,原master可能已經廢棄掉,待原master主機修復後,如果資料完整的情況下,可能想把原來master重新作為新主庫的slave,這時我們可以藉助當時自動切換時刻的MHA日誌來完成對原master的修復。下面是提取相關日誌的命令:
1 2 |
|
獲取上述資訊以後,就可以直接在修復後的master上執行change master to相關操作,重新作為從庫了。
最後補充一下郵件傳送指令碼send_report ,這個指令碼經過調整後可以使用,如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
|
告警郵件如下:
目前高可用方案可以一定程度上實現資料庫的高可用,出於對資料庫的高可用和資料一致性的要求,推薦使用MHA架構。
*************** 當你發現自己的才華撐不起野心時,就請安靜下來學習吧!***************
相關文章
- mysql高可用架構MHA搭建MySql架構
- 部署MHA+keepalived+ProxySQL高可用架構SQL架構
- MySQL高可用架構-MMM、MHA、MGR、PXCMySql架構
- MySQL 實現高可用架構之 MHAMySql架構
- Redis+Keepalived高可用環境部署記錄Redis
- ProxySQL Cluster 高可用叢集環境部署記錄SQL
- mysql高可用架構MHA搭建(centos7+mysql5.7.28)MySql架構CentOS
- 構建MHA實現MySQL高可用叢集架構MySql架構
- MySQL高可用架構之MHA 原理與實踐MySql架構
- MHA高可用架構的實現方式架構
- Mysql 5.7 MHA 高可用MySql
- MySQL高可用架構之Keepalived+主從架構部署MySql架構
- MySQL——MHA高可用群集部署及故障測試MySql
- MySQL高可用群集MHA部署及故障測試分析MySql
- MySQL叢集架構:MHA+MySQL-PROXY+LVS實現MySQL叢集架構高可用/高效能MySql架構
- MySQL資料庫實現高可用架構之MHA的實戰MySql資料庫架構
- Canal高可用架構部署架構
- Mysql高可用架構方案MySql架構
- 基於 MHA 高可用的 MySQLMySql
- MySQL 高可用架構之 MMM 架構MySql架構
- MySQL高可用方案-PXC(Percona XtraDB Cluster)環境部署詳解MySql
- MySQL 中常見的幾種高可用架構部署方案MySql架構
- MHA原始碼分析——環境部署原始碼
- MySQL高可用架構對比MySql架構
- Centos7.5基於MySQL5.7的 InnoDB Cluster 多節點高可用叢集環境部署記錄CentOSMySql
- 【DB寶45】MySQL高可用之MGR+Consul架構部署MySql架構
- Mysql 高可用(MHA)-讀寫分離(Atlas)MySql
- MySQL高可用架構設計分析MySql架構
- 基於MySQL Cluster + LVS + KeepAlived部署負載均衡高可用架構MySql負載架構
- MHA+MySQL主從配置實現MySQL高可用MySql
- MySQL高可用架構:mysql+keepalived實現MySql架構
- MySQL MHA部署 Part 5 MHA部署指南MySql
- MHA高可用架構工作原理?主庫當機處理過程架構
- MHA高可用+VIP漂移
- 高可用架構架構
- 【DB寶42】MySQL高可用架構MHA+ProxySQL實現讀寫分離和負載均衡MySql架構負載
- 構建生產環境可用的高可用kubernetes叢集
- Mysql MHA部署-04MHA配置MySql