【MySQL】常見slave 延遲原因以及解決方法
一 序言
在運維線上M-M 架構的MySQL資料庫時,接收的比較多關於主備延時的報警:
相信slave 延遲是MySQL dba 遇到的一個老生長談的問題了。先來分析一下slave延遲帶來的風險
1. 異常情況下,主從HA無法切換。HA 軟體需要檢查資料的一致性,延遲時,主備不一致。
2. 備庫複製hang會導致備份失敗(flush tables with read lock會900s超時)
3. 以 slave 為基準進行的備份,資料不是最新的,而是延遲。
二 如何解決
面對此類問題我們如何解決 ,如何規避?分析一下導致備庫延遲的幾種原因
1. ROW模式無主鍵、無索引或索引區分度不高.有如下特徵
a. show slave status 顯示position一直沒有變
b. show open tables 顯示某個表一直是 in_use 為 1
c. show create table 檢視錶結構可以看到無主鍵,或者無任何索引,或者索引區分度很差。
解決方法:
a. 找到表區分度比較高的幾個欄位, 可以使用這個方法判斷:
select count(*) from xx;
select count(*) from (select distinct xx from xxx) t;
如果2個查詢count(*)的結果差不多,說明可以對這些欄位加索引
b. 備庫stop slave;
可能會執行比較久,因為需要回滾事務。
c. 備庫
set sql_log_bin=0;
alter table xx add key xx(xx);
老的版本slave應用binlog時只會選擇第一個索引,需要把新加的索引放在最前面,可以先把老的索引刪掉,建新的索引,再把老的索引建上。可以放到一個sql中執行。
d. 備庫start slave
如果是innodb,可以透過show innodb status來檢視 rows_inserted,updated,deleted,selected這幾個指標來判斷。
如果每秒修改的記錄數比較多,說明覆制正在以比較快的速度執行。
2 MIXED模式無索引或SQL慢
在從庫上show full processlist 檢視到正在執行的SQL。
解決方法:
a. SQL比較簡單, 則檢查是否缺少索引,並新增索引。
b. 另一類是 insert into select from的語句,如果select 裡包含group by,多表關聯,可能效率會比較低。
這類可以到主庫把binlog_format改成row。
3 主庫上有大事務,導致從庫延時
現象解析binlog 發現類似於下圖的情況看
解決方法:
與開發溝通,增加快取,非同步寫入資料庫,減少直接對db的大量寫入。
4. 主庫寫入頻繁,從庫壓力跟不上導致延時
此類原因的主要現象是資料庫的 IUD 操作非常多,slave由於sql_thread單執行緒的原因追不上主庫。
解決方法:
a 升級從庫的硬體配置,比如ssd,fio.
b 使用@丁奇的預熱工具-relay fetch
在備庫sql執行緒執行更新之前,預先將相應的資料載入到記憶體中,並不能提高sql_thread執行緒執行sql的能力,也不能加快io_thread執行緒讀取日誌的速度。
c 使用多執行緒複製 阿里MySQL團隊實現的方案--基於行的並行複製。
該方案允許對同一張表進行修改的兩個事務並行執行,只要這兩個事務修改了表中的不同的行。這個方案可以達到事務間更高的併發度,但是侷限是必須使用Row格式的binlog。因為只有使用 Row格式的binlog才可以知道一個事務所修改的行的範圍,而使用Statement格式的binlog只能知道修改的表物件。
5. 資料庫中存在大量myisam表,在備份的時候導致slave 延遲
由於xtrabackup 工具備份到最後會執行flash tables with read lock ,對資料庫進行鎖表以便進行一致性備份,然後對於myisam表 鎖,會阻礙salve_sql_thread 停滯執行進而導致hang
該問題目前的比較好的解決方式是修改表結構為innodb儲存引擎的表。
三 擴充閱讀
[1] 怎樣解決MySQL資料庫主從複製延遲的問題
[2] 三種MySQL並行複製方案的分析
[3] 一種MySQL主從同步加速方案-改進
[4] MySQL多執行緒同步MySQL-Transfer介紹
在運維線上M-M 架構的MySQL資料庫時,接收的比較多關於主備延時的報警:
點選(此處)摺疊或開啟
- check_ins_slave_lag (err_cnt:1)critical-slavelag on ins:3306=39438
1. 異常情況下,主從HA無法切換。HA 軟體需要檢查資料的一致性,延遲時,主備不一致。
2. 備庫複製hang會導致備份失敗(flush tables with read lock會900s超時)
3. 以 slave 為基準進行的備份,資料不是最新的,而是延遲。
二 如何解決
面對此類問題我們如何解決 ,如何規避?分析一下導致備庫延遲的幾種原因
1. ROW模式無主鍵、無索引或索引區分度不高.有如下特徵
a. show slave status 顯示position一直沒有變
b. show open tables 顯示某個表一直是 in_use 為 1
c. show create table 檢視錶結構可以看到無主鍵,或者無任何索引,或者索引區分度很差。
解決方法:
a. 找到表區分度比較高的幾個欄位, 可以使用這個方法判斷:
select count(*) from xx;
select count(*) from (select distinct xx from xxx) t;
如果2個查詢count(*)的結果差不多,說明可以對這些欄位加索引
b. 備庫stop slave;
可能會執行比較久,因為需要回滾事務。
c. 備庫
set sql_log_bin=0;
alter table xx add key xx(xx);
老的版本slave應用binlog時只會選擇第一個索引,需要把新加的索引放在最前面,可以先把老的索引刪掉,建新的索引,再把老的索引建上。可以放到一個sql中執行。
d. 備庫start slave
如果是innodb,可以透過show innodb status來檢視 rows_inserted,updated,deleted,selected這幾個指標來判斷。
如果每秒修改的記錄數比較多,說明覆制正在以比較快的速度執行。
2 MIXED模式無索引或SQL慢
在從庫上show full processlist 檢視到正在執行的SQL。
解決方法:
a. SQL比較簡單, 則檢查是否缺少索引,並新增索引。
b. 另一類是 insert into select from的語句,如果select 裡包含group by,多表關聯,可能效率會比較低。
這類可以到主庫把binlog_format改成row。
3 主庫上有大事務,導致從庫延時
現象解析binlog 發現類似於下圖的情況看
解決方法:
與開發溝通,增加快取,非同步寫入資料庫,減少直接對db的大量寫入。
4. 主庫寫入頻繁,從庫壓力跟不上導致延時
此類原因的主要現象是資料庫的 IUD 操作非常多,slave由於sql_thread單執行緒的原因追不上主庫。
解決方法:
a 升級從庫的硬體配置,比如ssd,fio.
b 使用@丁奇的預熱工具-relay fetch
在備庫sql執行緒執行更新之前,預先將相應的資料載入到記憶體中,並不能提高sql_thread執行緒執行sql的能力,也不能加快io_thread執行緒讀取日誌的速度。
c 使用多執行緒複製 阿里MySQL團隊實現的方案--基於行的並行複製。
該方案允許對同一張表進行修改的兩個事務並行執行,只要這兩個事務修改了表中的不同的行。這個方案可以達到事務間更高的併發度,但是侷限是必須使用Row格式的binlog。因為只有使用 Row格式的binlog才可以知道一個事務所修改的行的範圍,而使用Statement格式的binlog只能知道修改的表物件。
5. 資料庫中存在大量myisam表,在備份的時候導致slave 延遲
由於xtrabackup 工具備份到最後會執行flash tables with read lock ,對資料庫進行鎖表以便進行一致性備份,然後對於myisam表 鎖,會阻礙salve_sql_thread 停滯執行進而導致hang
該問題目前的比較好的解決方式是修改表結構為innodb儲存引擎的表。
三 擴充閱讀
[1] 怎樣解決MySQL資料庫主從複製延遲的問題
[2] 三種MySQL並行複製方案的分析
[3] 一種MySQL主從同步加速方案-改進
[4] MySQL多執行緒同步MySQL-Transfer介紹
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/21374452/viewspace-2136029/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 【MySQL】六、常見slave 延遲原因以及解決方法MySql
- MySQL Slave延遲很大優化方法MySql優化
- mysql同步(複製)延遲的原因及解決方案MySql
- Mysql slave 延遲故障一列MySql
- Mysql 非同步複製延遲的原因及解決方案MySql非同步
- 【Mysql】Slave 延遲很大並且不動了MySql
- mysql同步問題之Slave延遲很大最佳化方法MySql
- 貼片電感器發燙常見原因以及解決方法詳解
- DVR常見故障原因及解決方法VR
- dede常見漏洞以及解決方法
- 從Mysql slave system lock延遲說開去MySql
- MySQL中slave監控的延遲情況分析MySql
- 設計方案--移動端延遲300ms的原因以及解決方案
- MySQL併發時經典常見的死鎖原因及解決方法MySql
- mysql主從同步(4)-Slave延遲狀態監控MySql主從同步
- MySQL主從延遲解決方法的歸納和總結MySql
- DNS故障的幾種常見原因及解決方法DNS
- MySQL主從複製延遲解決方案MySql
- Mysql 建立心跳錶來監控Replication的Slave是否延遲MySql
- 影響MySQL主從延遲的幾個因素及解決方法MySql
- keepalived 1.3.5常見配置以及常見問題解決
- Hadoop使用常見問題以及解決方法(轉載)Hadoop
- MySQL主從複製延遲原因及處理思路MySql
- CentOS6.5安裝mysql以及常見問題的解決CentOSMySql
- MySQL常見錯誤分析與解決方法總結MySql
- 幾種常見的延遲執行處理方式
- As常見問題解決方法
- javaWeb常見異常的解決方法JavaWeb
- JavaScript 除錯常見報錯以及原因JavaScript除錯
- HTTP 請求延遲解決方案HTTP
- MySQL:slave 延遲一列 外來鍵檢查和自增加鎖MySql
- 直播短影片原始碼,延遲任務的解決方法原始碼
- CPU常見小故障原因與解決辦法
- 級聯slave的延遲計算和query event exe time獲取方法
- mysqldump意外終止的原因以及解決方法MySql
- 【常見的SQL Server連線失敗錯誤以及解決方法】SQLServer
- Android的延遲實現的幾種解決方案以及原理分析Android
- MySQL組複製的幾個常見問題以及解決辦法MySql