看完這篇還不懂 MySQL 主從複製,可以回家躺平了~

ITPUB社群發表於2022-11-25

大家好,我是小羽。

我們在平時工作中,使用最多的資料庫就是 MySQL 了,隨著業務的增加,如果單單靠一臺伺服器的話,負載過重,就容易造成當機

這樣我們儲存在 MySQL 資料庫的資料就會丟失,那麼該怎麼解決呢?

其實在 MySQL 本身就自帶有一個主從複製的功能,可以幫助我們實現負載均衡和讀寫分離

對於主伺服器(Master)來說,主要負責寫,從伺服器(Slave)主要負責讀,這樣的話,就會大大減輕壓力,從而提高效率。

接下來,跟著小羽一起來看看它都有哪些核心知識點呢:

簡介

隨著業務的增長,一臺資料伺服器已經滿足不了需求了,負載過重。這個時候就需要減壓了,實現負載均衡讀寫分離,一主一叢或一主多從。

主伺服器只負責寫,而從伺服器只負責讀,從而提高了效率減輕壓力。

主從複製可以分為:

  • 主從同步:當使用者寫資料主伺服器必須和從伺服器同步了才告訴使用者寫入成功,等待時間比較長。

  • 主從非同步:只要使用者訪問寫資料主伺服器,立即返回給使用者。

  • 主從半同步:當使用者訪問寫資料主伺服器寫入並同步其中一個從伺服器就返回給使用者成功。

形式

一主一從

圖片

一主一從

一主多從

圖片

一主多從

一主一從和一主多從是我們現在見的最多的主從架構,使用起來簡單有效,不僅可以實現 HA,而且還能讀寫分離,進而提升叢集的併發能力

多主一從

圖片

多主一從

多主一從可以將多個 MySQL 資料庫備份到一臺儲存效能比較好的伺服器上。

雙主複製

圖片

雙主複製

雙主複製,也就是可以互做主從複製,每個 master 既是 master,又是另外一臺伺服器的 salve。這樣任何一方所做的變更,都會通過複製應用到另外一方的資料庫中。

級聯複製

圖片

級聯複製

級聯複製模式下,部分 slave 的資料同步不連線主節點,而是連線從節點

因為如果主節點有太多的從節點,就會損耗一部分效能用於 replication ,那麼我們可以讓 3~5 個從節點連線主節點,其它從節點作為二級或者三級與從節點連線,這樣不僅可以緩解主節點的壓力,並且對資料一致性沒有負面影響。

原理

MySQL 主從複製是基於主伺服器在二進位制日誌跟蹤所有對資料庫的更改。因此,要進行復制,必須在主伺服器上啟用二進位制日誌。

每個從伺服器從主伺服器接收已經記錄到日誌的資料。當一個從伺服器連線到主伺服器時,它通知主伺服器從伺服器日誌中讀取最後一個更新成功的位置。

從伺服器接收從那時發生起的任何更新,並在主機上執行相同的更新。然後封鎖等待主伺服器通知的更新。

從伺服器執行備份不會干擾主伺服器,在備份過程中主伺服器可以繼續處理更新。

過程

工作過程

MySQL 的主從複製工作過程大致如下:

  1. 從庫生成兩個執行緒,一個 I/O 執行緒,一個 SQL 執行緒;

  2. I/O 執行緒去請求主庫的 binlog,並將得到的 binlog 日誌寫到 relay log(中繼日誌) 檔案中;

  3. 主庫會生成一個 log dump 執行緒,用來給從庫 I/O 執行緒傳 binlog;

  4. SQL 執行緒會讀取 relay log 檔案中的日誌,並解析成具體操作,來實現主從的操作一致,而最終資料一致;

圖片

工作過程

請求流程

MySQL 建立請求的主從的詳細流程如下:

  1. 當從伺服器連線主伺服器時,主伺服器會建立一個 log dump 執行緒,用於傳送 binlog 的內容。在讀取 binlog 的內容的操作中,會物件主節點上的 binlog 加鎖,當讀取完成併傳送給從伺服器後解鎖。

  2. 當從節點上執行 start slave 命令之後,從節點會建立一個 IO 執行緒用來連線主節點,請求主庫中更新 binlog。IO 執行緒接收主節點 binlog dump 程式發來的更新之後,儲存到 relay-log 中。

  3. 從節點 SQL 執行緒負責讀取 realy-log 中的內容,解析成具體的操作執行,最終保證主從資料的一致性。

型別

非同步複製

一個主庫,一個或多個從庫,資料非同步同步到從庫。

圖片

非同步複製

這種模式下,主節點不會主動推送資料到從節點,主庫在執行完客戶端提交的事務後會立即將結果返給給客戶端,並不關心從庫是否已經接收並處理。

這樣就會有一個問題,主節點如果崩潰掉了,此時主節點上已經提交的事務可能並沒有傳到從節點上,如果此時,強行將從提升為主,可能導致新主節點上的資料不完整。

同步複製

在 MySQL cluster 中特有的複製方式。

當主庫執行完一個事務,然後所有的從庫都複製了該事務並成功執行完才返回成功資訊給客戶端。

因為需要等待所有從庫執行完該事務才能返回成功資訊,所以全同步複製的效能必然會收到嚴重的影響。

半同步複製

在非同步複製的基礎上,確保任何一個主庫上的事物在提交之前至少有一個從庫已經收到該事物並日志記錄下來。

圖片

半同步複製

介於非同步複製和全同步複製之間,主庫在執行完客戶端提交的事務後不是立刻返回給客戶端,而是等待至少一個從庫接收到並寫到 relay log 中才返回成功資訊給客戶端(只能保證主庫的 Binlog 至少傳輸到了一個從節點上),否則需要等待直到超時時間然後切換成非同步模式再提交。

相對於非同步複製,半同步複製提高了資料的安全性,一定程度的保證了資料能成功備份到從庫,同時它也造成了一定程度的延遲,但是比全同步模式延遲要低,這個延遲最少是一個 TCP/IP 往返的時間。所以,半同步複製最好在低延時的網路中使用。

半同步模式不是 MySQL 內建的,從 MySQL 5.5 開始整合,需要 master 和 slave 安裝外掛開啟半同步模式。

延遲複製

在非同步複製的基礎上,人為設定主庫和從庫的資料同步延遲時間,即保證資料延遲至少是這個引數。

方式

MySQL 主從複製支援兩種不同的日誌格式,這兩種日誌格式也對應了各自的複製方式。當然也有二者相結合的混合型別複製。

語句複製

基於語句的複製相當於邏輯複製,即二進位制日誌中記錄了操作的語句,通過這些語句在從資料庫中重放來實現複製。

這種方式簡單,二進位制檔案小,傳輸頻寬佔用小。但是基於語句更新依賴於其它因素,比如插入資料時利用了時間戳。

因此在開發當中,我們應該儘量將業務邏輯邏輯放在程式碼層,而不應該放在 MySQL 中,不易擴充。

特點

  • 傳輸效率高,減少延遲。

  • 在從庫更新不存在的記錄時,語句賦值不會失敗。而行復制會導致失敗,從而更早發現主從之間的不一致。

  • 設表裡有一百萬條資料,一條sql更新了所有表,基於語句的複製僅需要傳送一條sql,而基於行的複製需要傳送一百萬條更新記錄

行資料複製

基於行的複製相當於物理複製,即二進位制日誌中記錄的實際更新資料的每一行。

這樣導致複製的壓力比較大,日誌佔用的空間大,傳輸頻寬佔用大。但是這種方式比基於語句的複製要更加精確

特點

  • 不需要執行查詢計劃。

  • 不知道執行的到底是什麼語句。

  • 例如一條更新使用者總積分的語句,需要統計使用者的所有積分再寫入使用者表。如果是基於語句複製的話,從庫需要再一次統計使用者的積分,而基於行復制就直接更新記錄,無需再統計使用者積分。

混合型別的複製

一般情況下,預設採用基於語句的複製,一旦發現基於語句無法精確複製時,就會採用基於行的複製。

配置

配置主要要點如下:

# 如果在雙主複製結構中沒有設定ID的話就會導致迴圈同步問題
server_id=1

# 即日誌中記錄的是語句還是行更新或者是混合
binlog_format=mixed

# 在進行n次事務提交以後,Mysql將執行一次fsync的磁碟同步指令。將緩衝區資料重新整理到磁碟。
# 為0的話由Mysql自己控制頻率。
sync_binlog=n

# 為0的話,log buffer將每秒一次地寫入log file中並且重新整理到磁碟。
# mysqld程式崩潰會丟失一秒內的所有事務。
# 為1的話,每次事務log buffer會寫入log file並重新整理到磁碟。(較為安全)
# 在崩潰的時候,僅會丟失一個事務。
# 為2的話,每次事務log buffer會寫入log file,但一秒一次重新整理到磁碟
innodb_flush_logs_at_trx_commit=0

# 阻止從庫崩潰後自動啟動複製,給一些時間來修復可能的問題,
# 崩潰後再自動複製可能會導致更多的問題。並且本身就是不一致的
skip_slave_start=1 

# 是否將從庫同步的事件也記錄到從庫自身的bin-log中
# 允許備庫將重放的事件也記錄到自身的二進位制日誌中去,可以將備庫當做另外一臺主庫的從庫
log_slave_update 

# 日誌過期刪除時間,延遲嚴重的話會導致日誌檔案佔用磁碟
expire_logs_days=7

問題

延遲

當主庫的 TPS 併發較高的時候,由於主庫上面是多執行緒寫入的,而從庫的SQL執行緒是單執行緒的,導致從庫SQL可能會跟不上主庫的處理速度

解決方法

  • 網路方面:儘量保證主庫和從庫之間的網路穩定,延遲較小;

  • 硬體方面:從庫配置更好的硬體,提升隨機寫的效能;

  • 配置方面:儘量使 MySQL 的操作在記憶體中完成,減少磁碟操作。或升級 MySQL5.7 版本使用並行複製;

  • 建構方面:在事務中儘量對主庫讀寫,其它非事務的讀在從庫。消除一部分延遲帶來的資料庫不一致。增加快取降低一些從庫的負載。

資料丟失

當主庫當機後,資料可能丟失。

解決方法

使用半同步複製,可以解決資料丟失的問題。

注意事項

MySQL 需要注意以下事項:

  • MySQL 主從複製是 MySQL 高可用性,高效能(負載均衡)的基礎;

  • 簡單,靈活,部署方式多樣,可以根據不同業務場景部署不同複製結構;

  • 複製過程中應該時刻監控複製狀態,複製出錯或延時可能給系統造成影響;

  • MySQL 主從複製目前也存在一些問題,可以根據需要部署複製增強功能。

作用

主從複製帶來了很多好處,當我們的主伺服器出現問題,可以切換到從伺服器;可以進行資料庫層面的讀寫分離;可以在從資料庫上進行日常備份。還可以保證:

  1. 資料更安全:做了資料冗餘,不會因為單臺伺服器的當機而丟失資料;

  2. 效能大大提升:一主多從,不同使用者從不同資料庫讀取,效能提升

  3. 擴充套件性更優:流量增大時,可以方便的增加從伺服器,不影響系統使用;

  4. 負載均衡:一主多從相當於分擔了主機任務,做了負載均衡

應用場景

MySQL 主從複製叢集功能使得 MySQL 資料庫支援大規模高併發讀寫成為可能,同時有效地保護了物理伺服器當機場景的資料備份

橫向擴充套件

將工作負載分發到各 Slave 節點上,從而提高系統效能。

在這個場景下,所有的寫(write)和更新(update)操作都在 Master 節點上完成;所有的讀( read)操作都在 Slave 節點上完成。通過增加更多的 Slave 節點,便能提高系統的讀取速度。

資料安全

資料從 Master 節點複製到 Slave 節點上,在 Slave 節點上可以暫停複製程式。可以在 Slave 節點上備份與 Master 節點對應的資料,而不用影響 Master 節點的執行。

資料分析

實時資料可以在 Master 節點上建立,而分析這些資料可以在 Slave 節點上進行,並且不會對 Master 節點的效能產生影響。

遠距離資料分佈

可以利用複製在遠端主機上建立一份本地資料的副本,而不用持久的與Master節點連線。

拆分訪問

可以把幾個不同的從伺服器,根據公司的業務進行拆分。通過拆分可以幫助減輕主伺服器的壓力,還可以使資料庫對外部使用者瀏覽、內部使用者業務處理及 DBA 人員的備份等互不影響

相關文章