HBase工具之監控Region的可用和讀寫延時狀況
1、介紹HBase叢集上region數目由於業務驅動而越來越多,由於伺服器本身,網路以及hbase內部的一些不確定性bug等因素使得這些region可能面臨著不可用或響應延時情況。通過對region的監控,也可以反映出hdfs叢集的狀況
2、工具
org.apache.hadoop.hbase.tool.Canary 監控Region的可用和讀寫狀況
Usage: bin/hbase org.apache.hadoop.hbase.tool.Canary [opts] [table 1 [table 2…]]
where [opts] are:
-help Show this help and exit.
-daemon Continuous check at defined intervals.
-interval <N> Interval between checks (sec)
例如:執行${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.tool.Canary day_hotstatic 結果資訊如下:
read from region day_hotstatic,860010-2061300100_20131109_10_visit_00000027262,1386598604054.22af453addaff05464e585e7d148987b. column family c in 4msread from region day_hotstatic,860010-2061300100_20131201_2_exit_00000012418,1387389193938.9d19cd65ac9f9c3c2a04911cb73cfef7. column family c in 0ms
原理:它預設會取出Region的startKey,按照ColumnFamily分別執行一次Get操作,並列印出系統的延遲。對於Region出問題的情況下,會列印出failed的狀態。
2、不足
1)無法提供Region服務異常的實時報警。
2)未提供對於延遲的監控與報警。
基於此,我們就可以新增相應的報警功能,找出延遲超過最高限或者Region有問題的Table,並通過郵件或者message及時告警。
在出現hfile檔案無法seek或者Region offline的情況下,通過HBaseAdmin.assign(regionName)介面重新部署一次Region,這樣可以避免:
①.Region上storefile不一致(與hdfs上region顯示不一樣),在compaction異常或者split過程中。通過重新assign下可以重新載入這部分資料
②.Region處於Offline狀態,比如regionserver當機,叢集負載均衡等過程中region offline等
2、工具
org.apache.hadoop.hbase.tool.Canary 監控Region的可用和讀寫狀況
Usage: bin/hbase org.apache.hadoop.hbase.tool.Canary [opts] [table 1 [table 2…]]
where [opts] are:
-help Show this help and exit.
-daemon Continuous check at defined intervals.
-interval <N> Interval between checks (sec)
例如:執行${HBASE_HOME}/bin/hbase org.apache.hadoop.hbase.tool.Canary day_hotstatic 結果資訊如下:
read from region day_hotstatic,860010-2061300100_20131109_10_visit_00000027262,1386598604054.22af453addaff05464e585e7d148987b. column family c in 4msread from region day_hotstatic,860010-2061300100_20131201_2_exit_00000012418,1387389193938.9d19cd65ac9f9c3c2a04911cb73cfef7. column family c in 0ms
原理:它預設會取出Region的startKey,按照ColumnFamily分別執行一次Get操作,並列印出系統的延遲。對於Region出問題的情況下,會列印出failed的狀態。
2、不足
1)無法提供Region服務異常的實時報警。
2)未提供對於延遲的監控與報警。
基於此,我們就可以新增相應的報警功能,找出延遲超過最高限或者Region有問題的Table,並通過郵件或者message及時告警。
在出現hfile檔案無法seek或者Region offline的情況下,通過HBaseAdmin.assign(regionName)介面重新部署一次Region,這樣可以避免:
①.Region上storefile不一致(與hdfs上region顯示不一樣),在compaction異常或者split過程中。通過重新assign下可以重新載入這部分資料
②.Region處於Offline狀態,比如regionserver當機,叢集負載均衡等過程中region offline等
相關文章
- Hbase 之 某Region長期處於 RIT 狀態 ( 空洞 )
- hbase啟動時分配region的流程
- 監控 SQL Server 的執行狀況SQLServer
- MySQL中slave監控的延遲情況分析MySql
- Mysql 主從延時監控MySql
- oracle備庫延時的監控方法Oracle
- 監控SQL Server的執行狀況(1)SQLServer
- nagios監控例項 -- 伺服器基本狀況監控iOS伺服器
- Hbase0.94之後版本 region分裂策略
- mysql主從同步(4)-Slave延遲狀態監控MySql主從同步
- HBase-Region詳解
- HBase Region合併分析
- 磁硬碟陣列後如何檢測和監控硬碟健康狀況?硬碟陣列
- MySQL監控工具之orzdbaMySql
- Nginx狀態圖形化監控工具Nginx
- Docker 之 執行狀態監控Docker
- 監控 SQL Server 的執行狀況--常用檢測語句SQLServer
- 監控java程式啟動時的CPU使用情況Java
- 區域(Region)和可用區(Availability Zone)AI
- Mysql 主從延時監控(pt-heartbeat)詳解MySql
- 【工具】tsar 監控Linux系統狀態的利器Linux
- HBase資料的讀寫流程
- 監控index 的使用情況Index
- HBASE-使用問題-split region
- zanePerfor前端效能監控系統高可用之Mongodb副本集讀寫分離架構前端MongoDB架構
- 網站訪問狀態和超時時間監控報警設定網站
- Spark讀Hbase優化 --手動劃分region提高並行數Spark優化並行
- 硬碟監控和分析工具:Smartctl硬碟
- 效能監控和分析工具--nmon
- HBase -ROOT-和.META.表結構(region定位原理)
- redis監控工具之redis-liveRedis
- metricbeat 監控 nginx 情況Nginx
- 監控Oracle索引的使用情況Oracle索引
- 監控Nginx的工作狀態Nginx
- Spark 讀取 Hbase 優化 --手動劃分 region 提高並行數Spark優化並行
- 監控 Python 記憶體使用情況和程式碼執行時間!Python記憶體
- Ganglia+Hadoop+Hbase監控搭建流程Hadoop
- 監控mysql之orzdba和orztopMySql