HBase工具之監控Region的可用和讀寫延時狀況
1、介紹HBase叢集上region數目由於業務驅動而越來越多,由於伺服器本身,網路以及hbase內部的一些不確定性bug等因素使得這些region可能面臨著不可用或響應延時情況。通過對region的監控,也可以反映出hdfs叢集的狀況
2、工具
org.apache.hadoop.hbase.tool.Canary 監控Region的可用和讀寫狀況
Usage: bin/hbase org.apache.hadoop.hbase.tool.Canary [opts] [table 1 [table 2…]]
where [opts] are:
-help Show this help and exit.
-daemon Continuous check at defined intervals.
-interval <N> Interval between checks (sec)
例如:執行${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.tool.Canary day_hotstatic 結果資訊如下:
read from region day_hotstatic,860010-2061300100_20131109_10_visit_00000027262,1386598604054.22af453addaff05464e585e7d148987b. column family c in 4msread from region day_hotstatic,860010-2061300100_20131201_2_exit_00000012418,1387389193938.9d19cd65ac9f9c3c2a04911cb73cfef7. column family c in 0ms
原理:它預設會取出Region的startKey,按照ColumnFamily分別執行一次Get操作,並列印出系統的延遲。對於Region出問題的情況下,會列印出failed的狀態。
2、不足
1)無法提供Region服務異常的實時報警。
2)未提供對於延遲的監控與報警。
基於此,我們就可以新增相應的報警功能,找出延遲超過最高限或者Region有問題的Table,並通過郵件或者message及時告警。
在出現hfile檔案無法seek或者Region offline的情況下,通過HBaseAdmin.assign(regionName)介面重新部署一次Region,這樣可以避免:
①.Region上storefile不一致(與hdfs上region顯示不一樣),在compaction異常或者split過程中。通過重新assign下可以重新載入這部分資料
②.Region處於Offline狀態,比如regionserver當機,叢集負載均衡等過程中region offline等
2、工具
org.apache.hadoop.hbase.tool.Canary 監控Region的可用和讀寫狀況
Usage: bin/hbase org.apache.hadoop.hbase.tool.Canary [opts] [table 1 [table 2…]]
where [opts] are:
-help Show this help and exit.
-daemon Continuous check at defined intervals.
-interval <N> Interval between checks (sec)
例如:執行${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.tool.Canary day_hotstatic 結果資訊如下:
read from region day_hotstatic,860010-2061300100_20131109_10_visit_00000027262,1386598604054.22af453addaff05464e585e7d148987b. column family c in 4msread from region day_hotstatic,860010-2061300100_20131201_2_exit_00000012418,1387389193938.9d19cd65ac9f9c3c2a04911cb73cfef7. column family c in 0ms
原理:它預設會取出Region的startKey,按照ColumnFamily分別執行一次Get操作,並列印出系統的延遲。對於Region出問題的情況下,會列印出failed的狀態。
2、不足
1)無法提供Region服務異常的實時報警。
2)未提供對於延遲的監控與報警。
基於此,我們就可以新增相應的報警功能,找出延遲超過最高限或者Region有問題的Table,並通過郵件或者message及時告警。
在出現hfile檔案無法seek或者Region offline的情況下,通過HBaseAdmin.assign(regionName)介面重新部署一次Region,這樣可以避免:
①.Region上storefile不一致(與hdfs上region顯示不一樣),在compaction異常或者split過程中。通過重新assign下可以重新載入這部分資料
②.Region處於Offline狀態,比如regionserver當機,叢集負載均衡等過程中region offline等
相關文章
- Hbase 之 某Region長期處於 RIT 狀態 ( 空洞 )
- hbase啟動時分配region的流程
- 監控 SQL Server 的執行狀況SQLServer
- MySQL中slave監控的延遲情況分析MySql
- hbase region 合併
- Linux中監控磁碟分割槽和使用情況的幾個工具Linux
- HBase Region合併分析
- HBase-Region詳解
- 磁硬碟陣列後如何檢測和監控硬碟健康狀況?硬碟陣列
- Zabbix 5.0:磁碟自動發現和讀寫監控
- Docker 之 執行狀態監控Docker
- 區域(Region)和可用區(Availability Zone)AI
- HBase資料的讀寫流程
- 監控java程式啟動時的CPU使用情況Java
- zanePerfor前端效能監控系統高可用之Mongodb副本集讀寫分離架構前端MongoDB架構
- HBASE-使用問題-split region
- Mysql 主從延時監控(pt-heartbeat)詳解MySql
- Spark讀Hbase優化 --手動劃分region提高並行數Spark優化並行
- redis監控工具之redis-liveRedis
- 監控 Python 記憶體使用情況和程式碼執行時間!Python記憶體
- Spark 讀取 Hbase 優化 --手動劃分 region 提高並行數Spark優化並行
- metricbeat 監控 nginx 情況Nginx
- 網路實時監控工具:PeakHour for macMac
- 效能監控工具之Grafana+Prometheus+ExportersGrafanaPrometheusExport
- Redis服務監控之RedisLive安裝部署(親測可用)Redis
- Kubernetes監控實踐(2):可行監控方案之Prometheus和SensuPrometheus
- Java監控神器之psi-probe監控Tomcat和應用JavaTomcat
- HBase-Region太多的問題簡單總結
- MySQL監控工具MySql
- Oracle輕量級實時監控工具-oratopOracle
- mytop 使用介紹 mysql實時監控工具MySql
- 網站監控工具有哪些,8款好用的監控工具推薦網站
- 談服務可用性監控
- 百度智慧監控場景下的HBase實踐
- Hbase-原理-region合併和hfile的合併(大合併、小合併)
- git實戰-linux定時監控github更新狀態(二)LinuxGithub
- 前端異常監控之 Sentry的部署和使用前端
- hbase region server 無法啟動一例。Server