TiDB3.0.2版本某業務TiKV當機測試

o煙雨瀟瀟o發表於2019-08-21

                    TiDB3.0.2版本某業務TiKV當機測試

                                                              --2019-08-21 劉春雷

1、彙總

1.1、概述

資訊: 版本2.1.0 master版本,tidb例項3個,tikv機器4臺(例項14個)

問題:線上某tidb叢集的tikv機器當機後,QPS表現直接至0,且恢復時間較長,幾十分鐘級別,且需要當機的機器起來後,才能快速恢復業務

處理:升級, 2.1.0 master 版本 至  3.0.2  版本

測試: 進行TiKV當機測試(上面包含4個tikv例項)

1.2、測試彙總

此處:感謝官方支援升級~

2、具體

2.1、拓撲

3個tidb上層是 DNS 與TGW,流量被負載至3個tidb例項

tikv機器,單機4個tikv例項

2.2、叢集資訊

資料量:9T

regions:14w


2.3、當機

關閉某tikv機器,上面有4個tikv例項

2.4、監控情況

可以從監控看出:QPS有短暫的下降, 1500左右下降至 1000左右,大約影響時間 30s內

再次開啟後,QPS有下降, 1500下降至 1000左右,大約影響時間 1分半鐘左右

2.5、業務反饋

業務反映:沒有發現業務異常與報錯


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/28823725/viewspace-2654480/,如需轉載,請註明出處,否則將追究法律責任。

相關文章