一前言
MySQL 的主從複製作為一項高可用特性，用於將主庫的資料同步到從庫，在維護主從複製資料庫叢集的時候，作為專職的MySQL DBA，筆者相信大多數人都會遇到“Got fatal error 1236 from master when reading data from binary log” 這類的報錯/報警。本文整理了常見的幾種 error 1236 報錯，並給出相應的解決方法，有所不足之處，當然也希望各位讀者朋友指正。

二常見的error 1236 報錯
2.1 logevent超過max_allowed_packet 大小

Got fatal error 1236 from master when reading data from binary log: 'log event entry exceeded max_allowed_packet; Increase max_allowed_packet on master; the start event position from 'mysql-bin.006730' at 290066246, the last event was read from '/u01/my3309/log/mysql-bin.006730

【原因】
此類報錯和max_allowed_packet相關。首先max_allowed_packet控制著主從複製過程中，一個語句產生的二進位制binlog event大小，它的值必須是1024的倍數。出現此類錯誤的常見原因是
1 該引數在主備庫的配置大小不一樣，主庫的配置值大於從庫的配置值。從主庫傳遞到備庫的binlog event大小超過了主庫或者備庫的max_allowed_packet大小。
2 主庫有大量資料寫入時，比如在主庫上執行 laod data，insert into .... select 語句，產生大事務。
當主庫向從庫傳遞一個比從庫的max_allowed_packet 大的packet ，從庫接收該packet失敗，並報 “log event entry exceeded max_allowed_packet“。
【如何解決】
需要確保主備配置一樣，然後嘗試調大該引數的值。

set global max_allowed_packet =1*1024*1024*1024;
stop slave;
start slave

另外，5.6 版本中的 slave_max_allowed_packet_size 引數控制slave 可以接收的最大的packet 大小，該值通常大於而且可以覆蓋 max_allowed_packet 的配置, 進而減少由於上面的問題導致主從複製中斷。

2.2 slave 在主庫找不到binlog檔案

Got fatal error 1236 from master when reading data from binary log:

【原因】
該錯誤發生在從庫的io程式從主庫拉取日誌時，發現主庫的mysql_bin.index檔案中第一個檔案不存在。出現此類報錯可能是由於你的slave 由於某種原因停止了好長一段是時間，當你重啟slave 複製的時候，在主庫上找不到相應的binlog ,會報此類錯誤。或者是由於某些設定主庫上的binlog被刪除了，導致從庫獲取不到對應的binglog file。
【如何解決】
1 為了避免資料丟失，需要重新搭建slave 。
2 注意主庫binlog的清理策略，選擇基於時間過期的刪除方式還是基於空間利用率的刪除方式。
不要使用rm -fr 命令刪除binlog file，這樣不會同步修改mysql_bin.index 記錄的binlog 條目。在刪除binlog的時候確保主庫保留了從庫 show slave status 的Relay_Master_Log_File對應的binlog file。

2.3 主庫空間問題，日誌被截斷

Got fatal error 1236 from master when reading data from binary log: 'binlog truncated in the middle of event; consider out of disk space on master; the start event position from 'mysql-bin.006730' at 290066434, the last event was read from '/u01/my3309/log/mysql-bin.006730

【原因】
該錯誤和主庫的空間問題和sync_binlog配置有關，當主庫 sync_binlog=N不等於1且磁碟空間滿時,MySQL每寫N次binary log，系統才會同步到磁碟，但是由於儲存日誌的磁碟空間滿而導致MySQL 沒有將日誌完全寫入磁碟，binlog event被截斷。slave 讀取該binlog file時就會報錯"binlog truncated in the middle of event;"
當sync_binlog 的預設值是0，像作業系統刷其他檔案的機制一樣，MySQL不會同步到磁碟中去而是依賴作業系統來重新整理binary log。
當sync_binlog =N (N>0) ，MySQL 在每寫 N次二進位制日誌binary log時，會使用fdatasync()函式將它的寫二進位制日誌binary log同步到磁碟中去。
【如何解決】
在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始

stop slave;
change master to master_log_file='mysql-bin.006731', master_log_pos=4;
start slave;

2.4 主庫異常斷電,從庫讀取錯誤的position

120611 20:39:38 [ERROR] Error reading packet from server: Client requested master to start replication from impossible position ( server_errno=1236)
120611 20:39:38 [ERROR] Slave I/O: Got fatal error 1236 from master when reading data from binary log: 'Client requested master to start replication from impossible position', Error_code: 1236
120611 20:39:38 [Note] Slave I/O thread exiting, read up to log 'mysql-bin.000143', position 664526789

【原因】
該問題也是和sync_binlog=N不等於1有關，多出現在主機異常crash ，比如磁碟損壞，raid 卡損壞，或者主機異常掉電導致binlog 未及時同步到磁碟。從庫讀取了主庫binlog file中的不存在的binlog position ，一般比binlogfile 的end position 的值還要大。
【如何解決】
1 在從庫重新指向到主庫下一個可用的binlog file 並且從binlog file初始化的位置開始

stop slave;
change master to master_log_file='mysql-bin.000144', master_log_pos=4;
start slave;

2 主備庫設定 sync_binlog=1，但是設定為1的時候，會帶來效能下降。

三相關閱讀
1 max_allowed_packet 官方介紹
2 Percona MySQL的特性 max_binlog_files
3 sync_binlog innodb_flush_log_at_trx_commit 淺析

4 《主庫異常斷電,從庫讀取錯誤的position 案例》
5 《max_allowed_packet and binary log corruption in MySQL》

【MySQL】Got fatal error 1236原因和解決方法

相關文章