進入正題之前
上回我們聊到關於MySQL的replication。https://segmentfault.com/a/11… 在進入今天的正題之前,先說一個可能大家很容易踩的坑。
Authentication Plugins問題
上回中實踐部分用的是MySQL5.7。當你要把MySQL升級到MySQL8.0的時候,如果用同樣的方法change master然後start slave後檢視slave的狀態的時候可能會發現以下錯誤。
mysql> show slave statusG
...
Last_IO_Error: error connecting to master `root@10.1.0.102:3306` - retry-time: 60 retries: 1
...
slave沒有臉上master,這時候你的第一反應可能是change master寫錯了或者master的MySQL掛掉了等等。如果你的配置檔案裡沒有default_authentication_plugin
這個引數,那多半是在它那跌倒了。
在MySQL5.7時,default_authentication_plugin
的預設值是mysql_native_password
。而到了MySQL8.0後,預設值變成了caching_sha2_password
,也就是說現在的密碼預設被加密了,當然用以前的方法是連不上master伺服器的了。下面兩個方法僅供參考。
解決方法一
如果你之前一直使用mysql_native_password
,並且很多工具都是在此之上寫出來的。這樣的話建議在MySQL8.0中繼續使用, 只要在在master的配置檔案my.cnf中設定default_authentication_plugin = mysql_native_password
就行了。
解決方法二
如果你想使用caching_sha2_password,master和slave必須同時設定成支援加密連結。首先必須在master和slave中設定ssl連線。
建立master和slave的配對證書。(OpenSSL)
//自簽名一個ca
$ openssl genrsa 2048 > ca-key.pem
$ openssl req -new -x509 -nodes -days 3600 -key ca-key.pem -out ca.pem
//用上面的ca籤一個服務端證書
$ openssl req -newkey rsa:2048 -days 3600 -nodes -keyout server-key.pem -out server-req.pem
$ openssl rsa -in server-key.pem -out server-key.pem
$ openssl x509 -req -in server-req.pem -days 3600 -CA ca.pem -CAkey ca-key.pem -set_serial 01 -out server-cert.pem
//用上面的ca籤一個客戶端證書
$ openssl req -newkey rsa:2048 -days 3600 -nodes -keyout client-key.pem -out client-req.pem
$ openssl rsa -in client-key.pem -out client-key.pem
$ openssl x509 -req -in client-req.pem -days 3600 -CA ca.pem -CAkey ca-key.pem -set_serial 01 -out client-cert.pem
master和slave的配置檔案中加入
//my.cnf
...
[mysqld]
ssl-ca=ca.pem
ssl-cert=server-cert.pem
ssl-key=server-key.pem
...
[client]
ssl-ca=ca.pem
ssl-cert=client-cert.pem
ssl-key=client-key.pem
...
slave change master, 將MASTER_SSL設成1。replication成功。
mysql> change master to
-> MASTER_HOST = `10.1.0.102`,
-> MASTER_USER = `root`,
-> MASTER_LOG_FILE = `binlog.000002`,
-> MASTER_LOG_POS = 154,
-> MASTER_SSL = 1;
Query OK, 0 rows affected, 1 warning (0.06 sec)
mysql> start slave;
設定ssl還是很麻煩的,官方也提供了一個指令碼方便大家設定ssl連線。https://dev.mysql.com/doc/ref…
SHOW SLAVE STATUS
今天將介紹的主角是show slave status這個命令,
mysql> show slave statusG
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 10.1.0.102
Master_User: root
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: binlog.000002
Read_Master_Log_Pos: 155
Relay_Log_File: 29d3afe99c90-relay-bin.000002
Relay_Log_Pos: 319
Relay_Master_Log_File: binlog.000002
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 155
Relay_Log_Space: 534
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: Yes
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Master_Server_Id: 11
Master_UUID: c41449f4-c3a3-11e8-b5c6-02420a010066
Master_Info_File: mysql.slave_master_info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set:
Executed_Gtid_Set:
Auto_Position: 0
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
Master_public_key_path:
Get_master_public_key: 0
1 row in set (0.00 sec)
mysql>
這個命令也就是輸出一些slave的命令。為什麼說這個命令重要,首先通過這個命令可以實時掌握replication的狀況,而是在實際的運營中,replication出了問題通過這個命令也可以第一時間定位問題。瞭解這個命令中各引數的含義對於主從關係的MySQL運營維護有這重要的實際意義。
Slave_IO_State
當前slave的IO執行緒的狀況。是show processlist裡IO執行緒state的複製。Waiting for master to send event
slave正在等待master更新。如果等待時間超過slave_net_timeout(my.cnf設定),IO執行緒為重連master。
Waiting for the slave SQL thread to free enough relay log space
如果你設定了relay_log_space_limit
,當relay log大小超過這個值以後,IO執行緒會先等SQL執行緒刪掉一部分relay log。
全部的state,https://dev.mysql.com/doc/ref…
MASTER_HOST,MASTER_USER,MASTER_PORT
master的地址,連線使用者名稱,埠等的資訊。
Connect_Retry
當master和slave之前出現連線問題時,每隔這個時間就會嘗試一次重連master。可用過change master設定這個值。
Master_Log_File, Relay_Log_File, Relay_Master_Log_File
Master_Log_File
當前IO從master讀取的binlog的檔名。Relog_Log_File
slave的SQL先前當讀取的relay log檔名。Relay_Master_log_File
當前SQL執行的最新的SQL Event是包含在master哪個binlog檔案中的。
Read_Master_Log_Pos, Relay_Log_Pos, Exec_Master_Log_Pos
這三個引數可以說是至關重要,也經常被搞混。Read_Master_Log_Pos
I/O讀取到的log在master的binlog中的位置。
Relay_Log_Pos
SQL執行到的Relay Log的位置。
Exec_Master_Log_Pos
SQL執行到的SQL Event在master的binlog中的位置。
如果Read_Master_Log_Pos
和master的show master status的位置一樣,而Exec_Master_Log_Pos
的值小於它們,那說明SQL執行緒出現了過載,正在執行一個非常熬時間的SQL或者slave伺服器的效能出現惡化等等。
Slave_IO_Running, Slave_SQL_Running
IO執行緒,SQL執行緒是否在執行。
Slave_IO_Running = NO,IO執行緒沒執行。
Slave_IO_Running = Connecting, IO執行緒正在執行,但是沒連上master。
Slave_IO_Running = YES,IO執行緒在執行,並且連上了master。
Relay_Log_Space
Relay log的全部加起來的大小
Last_Errno, Last_Error
SQL執行緒上次的執行錯誤資訊
Master_SSL_*
SSL連線時的設定。開頭的ssl連線的例子中,如果我們沒在slave中my.cnf設定證明書資訊,我們需要通過change master手動設定。
Replicate_Do_DB, Replicate_Ignore_DB, Replicate_Do_Table, Replicate_Ignore_Table, Replicate_Wild_Do_Table, Replicate_Wild_Ignore_Table
Replication可以通過在my.cnf中設定–replicate-do-table等來設定具體同步哪些庫或表。
Seconds_Behind_Master
簡單來說,就是slave比master慢了多少。如果slave比master慢了很多,讀寫分離的架構中,使用者讀取到的資料就不是最新的,運營事故就很容易發生。一般情況下,如果這個值過大,我們可以考慮是否是slave伺服器SQL執行緒出問題了。
如果對這個值是怎麼計算出來的感興趣的通許可以看一下這篇文章。
http://mysql.taobao.org/month…
需要記得一點的就是,當網路狀況很差的時候,這個值會一直是0。所以只有在網路環境很好的前提下,這個值才能表示slave比master慢多少。所以這個引數有時候也並不可靠。
Channel_name
channel是指我們可以在slave同時指定多個master進行replication,用不同的channel名來進行區分。這個也叫multi-source replication。再合併多個master的時候很有用。實際操作也只要在change master to後面加上for channel欄位就可以了
。同樣start/stop slave後面也加上for channel就行了。
總結
今天就講到這,上面只是介紹了一部分可能會場用到的引數,想了解其他引數的可以看官方文件。https://dev.mysql.com/doc/ref…。
下章講一下一些在運營中常見的一些主從切換的方法。