MySQL資料庫的高可用性分析

發表於2016-11-27

MySQL資料庫是目前開源應用最大的關係型資料庫，有海量的應用將資料儲存在MySQL資料庫中。儲存資料的安全性和可靠性是生產資料庫的關注重點。本文分析了目前採用較多的保障MySQL可用性方案。

MySQL Replication

MySQL Replication是MySQL官方提供的主從同步方案，用於將一個MySQL例項的資料，同步到另一個例項中。Replication為保證資料安全做了重要的保證，也是現在運用最廣的MySQL容災方案。Replication用兩個或以上的例項搭建了MySQL主從複製叢集，提供單點寫入，多點讀取的服務，實現了讀的scale out。

圖1. MySQL Replication主從複製叢集

如圖一所示，一個主例項（M），三個從例項（S），通過replication，Master生成event的binlog，然後發給slave，Slave將event寫入relaylog，然後將其提交到自身資料庫中，實現主從資料同步。對於資料庫之上的業務層來說，基於MySQL的主從複製叢集，單點寫入Master，在event同步到Slave後，讀邏輯可以從任何一個Slave讀取資料，以讀寫分離的方式，大大降低Master的執行負載，同時提升了Slave的資源利用。

對於高可用來說，MySQL Replication有個重要的缺陷：資料複製的時延。在通常情況下，MySQL Replication資料複製是非同步的，即是MySQL寫binlog後，傳送給Slave並不等待Slave返回確認收到，本地事務就提交了。一旦出現網路延遲或中斷，資料延遲傳送到Slave側，主從資料就會出現不一致。在這個階段中，Master一旦當機，未傳送到Slave的資料就丟失了，無法做到資料的高可用。

為了解決這個問題，google提供瞭解決方案：半同步和同步複製。在資料非同步複製的基礎之上，做了一點修改。半同步複製是Master等待event寫入Slave的relay後，再提交本地，保證Slave一定收到了需要同步的資料。同步複製不不僅是要求Slave收到資料，還要求Slave將資料commit到資料庫中，從而保證每次的資料寫入，主從資料都是一致的。

基於半同步和同步複製，MySQL Replication的高可用得到了質的提升，特別是同步複製。基於同步複製的MySQL Replication叢集，每個例項讀取的資料都是一致的，不會存在Slave幻讀。同時，Master當機後，應用程式切換到任何一個Slave都可以保證讀寫資料的一致性。但是，同步複製帶來了重大的效能下降，這裡需要做一個折衷。另外，MySQL Replication的主從切換需要人工介入判斷，同時需要Slave的replaylog提交完畢，故障恢復時間會比較長。

MySQL Fabric

MySQL Fabric是MySQL社群提供的管理多個MySQL服務的擴充套件。高可用是它設計的主要特性之一。

Fabric將兩個及以上的MySQL例項劃分為一個HA Group。其中的一個是主，其餘的都是從。HA Group保證訪問指定HA Group的資料總是可用的。其基礎的資料複製是基於MySQL Replication，然後，Fabric提供了更多的特性：

失效檢測和恢復：Fabric監控HA Group中的主例項，一旦發現主例項失效，Fabric會從HA Group中剩餘的從例項中選擇一個，並將其提升為主例項。

讀寫均衡：Fabric可以自動的處理一個HA Group的讀寫操作，將寫操作傳送給主例項，而讀請求在多個從例項之間做負載均衡。

圖2. Fabric

MHA

MHA（MySQL-master-ha）是目前廣泛使用的MySQL主從複製的高可用方案。MHA設計目標是自動實現主例項當機後，從機切換為主，並儘量降低切換時延（通常在10-30s內切換完成）。同時，由MHA保證在切換過程中的資料一致性。MHA對MySQL的主從複製叢集非常友好，沒有對叢集做任何侵入性的修改。

MHA的一個重點特性是：在主例項當機後，MHA可以自動的判斷主從複製叢集中哪個從例項的relaylog是最新的，並將最新從例項的差異log“應用”到其餘的從例項中，從而保證每個例項的資料一致。通常情況下，MHA需要10s左右檢測主例項異常，並將主例項關閉從而避免腦裂。然後再用10s左右將差異的log event同步，並啟用新的Master。整個MHA的RTO時間大約在30s。

MySQL Cluster

MySQL Cluster是一個高度可擴充套件的，相容ACID事務的實時資料庫，基於分散式架構不存在單點故障，MySQL Cluster支援自動水平擴容，並能做自動的讀寫負載均衡。

MySQL Cluster使用了一個叫NDB的記憶體儲存引擎來整合多個MySQL例項，提供一個統一的服務叢集。如圖三所示。

圖3. MySQL Cluster組成

MySQL Cluster由SQL Nodes，DataNodes，和NDB Management Server組成。SQL Nodes是應用程式的介面，像普通的mysqld服務一樣，接受使用者的SQL輸入，執行並返回結果。Data Nodes是資料儲存節點，NDB Management Server用來管理叢集中的每個node。

MySQL Cluster採用了新的資料分片和容錯的方式來實現資料安全和高可用。其由Partition，Replica，Data Node，Node Group構成。

Partition：NDB一張表的一個資料分片，包含一張表的一部分資料。

Replica：一個Partition的拷貝。一個Partition可以有一個或多個Replica，一個Partition的所有Replica資料都是一致的。

Data Node：Replica的儲存載體，每個Node儲存一個或多個Replica。

Node Group：一個Data Node的集合。

圖4. MySQL Cluster資料高可用

一個MySQL Cluster有4個Node，被分為了兩個Grou。Node1和2歸屬於Group0，Node3和4歸屬於Group1,。有一張表被分為4個Partition，並分別有兩個Replica。Partition0和Partition2的兩個Replica，分別儲存在Node1和Node2上，Pratition1和Partition3的兩個Replica分別存在Node3和Node4上。這樣，對於一張表的一個Partition來說，在整個叢集有兩份資料，並分佈在兩個獨立的Node上，實現了資料容災。同時，每次對一個Partition的寫操作，都會在兩個Replica上呈現，如果Primary Replica異常，那麼Backup Replica可以立即提供服務，實現資料的高可用。

小結

本文分析了目前MySQL使用較多的幾種MySQL資料複製和高可用方案，從使用來看，MySQL Replication是使用最為廣泛的資料複製方案，因為是MySQL原生支援，針對其在不同場景下的一些缺陷，衍生出了半同步複製，強同步複製等資料高可用的方案。在此基礎之上，為了運維方便，MySQL Fabric和MHA應運而生，從不同的方向解決了主從切換時資料一致性問題和流程自動化的問題。此外，隨著分散式系統架構和方案的逐步成熟。MySQL Cluster設計了全新的分散式架構，採用多副本，Sharding等特性，支援水平擴充套件，做到了5個9的資料庫服務質量保證。

參考文獻
1.http://dev.mysql.com/doc/refman/5.7/en/mysql-cluster.html
2.https://code.google.com/p/mysql-master-ha/
3.https://www.mysql.com/products/enterprise/fabric.html

5、pgpool-II高可用性（一）資料庫的高可用性
2020-12-01
資料庫
資料庫高可用性簡史
2018-10-15
資料庫
MySQL資料庫SYS CPU高的可能性分析
2020-09-30
MySql資料庫
使用 MaxScale 實現資料庫的高可用性和彈性
2024-04-13
資料庫
mysql資料庫磁碟io高的排查
2020-04-11
MySql資料庫
MySQL資料庫高可用方案
2020-08-05
MySql資料庫
MySQL資料庫優化分析
2019-03-29
MySql資料庫優化
Python高階 -- 07 MySQL資料庫
2018-03-14
PythonMySql資料庫
MySQL 高可用性—keepalived+mysql雙主
2019-03-05
MySql
python資料庫-MySQL資料庫高階查詢操作(51)
2019-07-11
Python資料庫MySql
GitHub 的 MySQL 高可用性實踐分享
2018-07-09
GithubMySql
瀚高資料庫相容Mysql的unhex函式
2021-11-11
資料庫MySql函式
3.2 改變資料庫可用性
2020-03-14
資料庫
確保Oracle 11g R2資料庫高可用性WQ
2022-03-21
Oracle資料庫
mysql 資料庫效能分析工具簡介
2024-04-17
MySql資料庫
【MySQL】資料庫事務深入分析
2019-09-16
MySql資料庫
如何透過SQLyog分析MySQL資料庫
2020-05-05
MySql資料庫
MySQL資料庫故障分析-鎖等待(一)
2022-06-12
MySql資料庫
MySQL資料庫架構——高可用演進
2021-02-08
MySql資料庫架構
故障分析 | MySQL 資料庫升級後，資料庫怎麼卡住了
2022-06-09
MySql資料庫
資料庫實踐丨MySQL多表join分析
2020-09-03
資料庫MySql
HBase可用性分析與高可用實踐
2020-04-26
mysql資料庫的索引
2019-05-15
MySql資料庫索引
[資料庫]【MySQL】MySQL資料庫規範總結
2019-03-10
資料庫MySql
如何使用MySQL資料庫來分析Apache日誌？
2021-08-28
MySql資料庫Apache
Mysql資料庫配置檔案(my.ini)分析
2022-05-13
MySql資料庫
MySQL資料庫中timediff()函式，在瀚高資料庫中如何替換使用？
2022-12-28
MySql資料庫函式
資料庫（MySQL）
2019-04-17
資料庫MySql
MYSQL資料庫
2024-05-31
MySql資料庫
資料庫-MySQL
2021-07-30
資料庫MySql
資料庫 MySQL
2021-01-04
資料庫MySql
分析型資料庫：分散式分析型資料庫
2023-04-17
資料庫分散式
Mysql資料庫-資料模型
2024-05-26
MySql資料庫模型
MySQL資料庫資料管理
2020-10-15
MySql資料庫
MySQL資料庫分散式事務XA的實現原理分析
2019-10-18
MySql資料庫分散式
MySQL資料庫實現高可用架構之MHA的實戰
2022-03-01
MySql資料庫架構
MySQL預設資料庫之mysql庫
2019-07-21
MySql資料庫
MySQL資料庫的恢復
2020-04-30
MySql資料庫
MySQL資料庫遷移與MySQL資料庫批量恢復
2021-02-04
MySql資料庫

MySQL資料庫的高可用性分析

MySQL Replication

MySQL Fabric

MHA

MySQL Cluster

小結

相關文章