HBase工具之監控Region的可用和讀寫延時狀況

@dailidong@發表於2019-05-13

原文網址 : https://flycode.co/archives/129745

1、介紹HBase叢集上region數目由於業務驅動而越來越多，由於伺服器本身，網路以及hbase內部的一些不確定性bug等因素使得這些region可能面臨著不可用或響應延時情況。通過對region的監控，也可以反映出hdfs叢集的狀況

2、工具
org.apache.hadoop.hbase.tool.Canary 監控Region的可用和讀寫狀況
Usage: bin/hbase org.apache.hadoop.hbase.tool.Canary [opts] [table 1 [table 2…]]
where [opts] are:
-help       Show this help and exit.
-daemon       Continuous check at defined intervals.
-interval <N>  Interval between checks (sec)

例如：執行${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.tool.Canary day_hotstatic 結果資訊如下：
read from region day_hotstatic,860010-2061300100_20131109_10_visit_00000027262,1386598604054.22af453addaff05464e585e7d148987b. column family c in 4msread from region day_hotstatic,860010-2061300100_20131201_2_exit_00000012418,1387389193938.9d19cd65ac9f9c3c2a04911cb73cfef7. column family c in 0ms

原理：它預設會取出Region的startKey,按照ColumnFamily分別執行一次Get操作，並列印出系統的延遲。對於Region出問題的情況下，會列印出failed的狀態。

2、不足
1）無法提供Region服務異常的實時報警。
2）未提供對於延遲的監控與報警。

基於此,我們就可以新增相應的報警功能，找出延遲超過最高限或者Region有問題的Table，並通過郵件或者message及時告警。
在出現hfile檔案無法seek或者Region offline的情況下，通過HBaseAdmin.assign(regionName)介面重新部署一次Region，這樣可以避免：
①.Region上storefile不一致(與hdfs上region顯示不一樣),在compaction異常或者split過程中。通過重新assign下可以重新載入這部分資料
②.Region處於Offline狀態，比如regionserver當機，叢集負載均衡等過程中region offline等

Hbase 之某Region長期處於 RIT 狀態 ( 空洞 )
2018-03-19
hbase啟動時分配region的流程
2020-11-27
監控 SQL Server 的執行狀況
2019-05-07
SQLServer
MySQL中slave監控的延遲情況分析
2021-09-09
MySql
hbase region 合併
2022-07-04
Linux中監控磁碟分割槽和使用情況的幾個工具
2021-09-27
Linux
HBase Region合併分析
2018-09-15
HBase-Region詳解
2018-08-24
磁硬碟陣列後如何檢測和監控硬碟健康狀況？
2018-09-29
硬碟陣列
Zabbix 5.0：磁碟自動發現和讀寫監控
2021-05-28
Docker 之執行狀態監控
2018-07-15
Docker
區域（Region）和可用區（Availability Zone）
2019-06-21
AI
HBase資料的讀寫流程
2022-01-14
監控java程式啟動時的CPU使用情況
2024-05-01
Java
zanePerfor前端效能監控系統高可用之Mongodb副本集讀寫分離架構
2018-11-14
前端MongoDB架構
HBASE-使用問題-split region
2021-05-08
Mysql 主從延時監控(pt-heartbeat)詳解
2021-07-16
MySql
Spark讀Hbase優化 --手動劃分region提高並行數
2018-12-15
Spark優化並行
redis監控工具之redis-live
2019-08-19
Redis
監控 Python 記憶體使用情況和程式碼執行時間！
2024-01-11
Python記憶體
Spark 讀取 Hbase 優化 --手動劃分 region 提高並行數
2018-12-16
Spark優化並行
metricbeat 監控 nginx 情況
2019-01-19
Nginx
網路實時監控工具：PeakHour for mac
2024-01-09
Mac
效能監控工具之Grafana+Prometheus+Exporters
2021-06-12
GrafanaPrometheusExport
Redis服務監控之RedisLive安裝部署（親測可用）
2019-05-23
Redis
Kubernetes監控實踐（2）：可行監控方案之Prometheus和Sensu
2019-09-27
Prometheus
Java監控神器之psi-probe監控Tomcat和應用
2019-08-30
JavaTomcat
HBase-Region太多的問題簡單總結
2018-12-19
MySQL監控工具
2019-07-30
MySql
Oracle輕量級實時監控工具-oratop
2020-02-20
Oracle
mytop 使用介紹 mysql實時監控工具
2021-09-09
MySql
網站監控工具有哪些，8款好用的監控工具推薦
2020-12-31
網站
談服務可用性監控
2020-12-24
百度智慧監控場景下的HBase實踐
2019-03-15
Hbase-原理-region合併和hfile的合併（大合併、小合併）
2020-11-27
git實戰-linux定時監控github更新狀態（二）
2021-09-21
LinuxGithub
前端異常監控之 Sentry的部署和使用
2018-08-15
前端
hbase region server 無法啟動一例。
2021-05-26
Server

HBase工具之監控Region的可用和讀寫延時狀況

相關文章