使用pt工具檢測MySQL主從延遲(r12筆記第7天)

jeanron100發表於2017-03-18

 今天翻看了下《高效能MySQL》,真是讓人拍手稱絕,裡面的很多實戰思路非常不錯,各種問題分析如數家珍,如果是有一定基礎的同學,看起來會非常不錯。

   當然裡面提到的一個地方,感覺很有意思,那就是主從延遲的一個測算思路。書中他們是透過建立一張表,插入時間相關的資料,值得一提的是這個表的儲存引擎是Federated,主要就是為了完成類似Oracle DB link一樣的特殊需求,在備庫端來對比這個時間差來得到一個相對精準的延遲值。

   當然有的同學可能會說,我們有show slave status裡面的Seconds_behind_master的選項嘛,那個可不能當做嚴格意義上的主從延遲標準,儘管看上去這個值都很小,接近於0.

   書中也提到了一個工具,那就是pt-heartbeat。這個工具算是一個比較主流的測試工具,使用起來也非常便捷,安裝好pt工具集之後,這只是其中的一個。

   工具的安裝部署可以參考

      Percona-toolkit的安裝和配置(r8筆記第86天)
      MySQL主從不一致的修復過程

   我們建立一個使用者pt_checksum,方便以後做資料修復等,許可權都一併給到。

GRANT SELECT, PROCESS, SUPER, REPLICATION SLAVE ON *.* TO 'pt_checksum'@'10.127.%.%' IDENTIFIED BY 'pt_checksum';   然後我們給予這個使用者訪問test資料庫的許可權。

grant all privileges on test.* to pt_checksum@'10.127.%.%';   工具具體的引數可以參考pt-heartbeat --help來看到,我給出要點即可。

   我們來建立測試表,在後臺啟動這個心跳守護程式,其中的create-table就是建立測試表,interval是間隔1秒鐘,最小可以到0.01秒,update是更新test庫上的這個測試表,而replace則是更新替換表裡的時間,無須考慮表裡是否有資料,daemonize是後臺執行的標註。

pt-heartbeat h='10.127.128.99',u='pt_checksum',p='pt_checksum',P=3306 -D test --create-table --interval=1 --update --replace --daemonize   使用ps命令可以看到如下的heartbeat程式,或者換個口味,用pgrep -fl pt-heartbeat也可以檢視。

# ps -ef|grep heartbeat
root     19920     1  0 22:35 ?        00:00:00 perl /usr/local/bin/pt-heartbeat h=10.127.128.99,u=pt_checksum,p=pt_checksum,P=3306 -D test --create-table --interval=1 --update --replace --daemonize   接下來的就是重點工作了,我們可以開啟monitor選項來監控主從延遲的情況,有一點需要提一下,就是需要設定server-id

# pt-heartbeat h='10.127.xx.xx',u='pt_checksum',p='pt_checksum',P=3306 -D test --table=heartbeat --monitor
The --master-server-id option must be specified because the heartbeat table `test`.`heartbeat` uses the server_id column for --update or --check but the server's master could not be automatically determined.
Please read the DESCRIPTION section of the pt-heartbeat POD.主庫上快速檢視。

> show slave hosts;
+-----------+------+------+-----------+--------------------------------------+
| Server_id | Host | Port | Master_id | Slave_UUID                           |
+-----------+------+------+-----------+--------------------------------------+
|     13058 |      | 3306 |        20 | c6d66211-a645-11e6-a2b6-782bcb472f63 |
+-----------+------+------+-----------+--------------------------------------+
1 row in set (0.01 sec)結果和show variables like 'server%'結果是一致的,更快速高效。
  我們檢視延遲的情況。

# pt-heartbeat h='10.127.xx.xx',u='pt_checksum',p='pt_checksum',P=3306 -D test --table=heartbeat --monitor --master-server-id=20
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s ]   可以看到目前的環境中是誒呦任何延遲的,方括號裡面的指標是什麼意思,可以使用frames來定製,比如預設是1m,5m,15m,我們可以定製,比如顯示為1m,2m,3m,4m這樣。

# pt-heartbeat h='10.127.xx.xx',u='pt_checksum',p='pt_checksum',P=3306 -D test --table=heartbeat --monitor --master-server-id=20 --frames=1m,2m,3m,4m
0.00s [  0.00s,  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s,  0.00s ]
0.00s [  0.00s,  0.00s,  0.00s,  0.00s ]   有的同學可能說,怎麼都顯示為0,如果用sysbench壓一下,立馬或有延遲的明顯差異。我們在後面整體對比測試一下。

  如果想即查即看,就看一次,可以使用check選項,當然這個值就沒有frame的時間範圍了。

# pt-heartbeat h='10.127.128.99',u='pt_checksum',p='pt_checksum',P=3306 -D test --table=heartbeat  --master-server-id=20  --check
0.00   當然有進有出,我們開啟了後臺守護程式,本質上是個perl指令碼,如果要停止,也規範一些,使用stop選項來做,會生辰改一個臨時檔案,下次需要重新啟動的話,需要清理掉這個檔案。

# pt-heartbeat h='10.127.xx.xx',u='pt_checksum',p='pt_checksum',P=3306 -D test --stop
Successfully created file /tmp/pt-heartbeat-sentinel

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23718752/viewspace-2135616/,如需轉載,請註明出處,否則將追究法律責任。

相關文章