ganglia 監控hadoop 叢集的配置檔案問題的一個說明.
ganglia 是監控的hadoop 叢集 的最佳系統.
安裝步驟就不寫了. 比較簡單.
主要說下安裝過程, hadoop 的metrics 的配置問題.
hadoop-metrics2.properties
如果採用預設配置, 一般情況下, 你會苦不堪言.
主要問題是 預設的把所有的metrics 監控項 全部監控出來了.
那麼就帶來了一個問題.
每個任務, 會派生出 很多container ,然後每個container 又有很多指標.
因為一直忙著救火, 就沒有 截圖保留案底了.
我統計一下 , 一個hadoo 節點 下面 關於container 的 rrd 檔案就有11700+
單個hadoop 節點 在一天內的監控資料 大於 7.5GB .
到什麼情況呢, 在ganglia 裡面已經無法開啟單個節點的監控頁面了. 直接死了.
同樣的hbase 的 hadoop-metrics2-hbase.properties 中也會涉及到
regionserver 的問題. 每個節點 上有很多regions ,然後每個region 都涉及到N多的metrics 監控項.
然後導致rrd 檔案暴漲. 效果跟前面一樣. 煩死人.
怎麼解決呢? 查文件.
在官方文件裡找到了一點答案. 然後就開始各種演繹.
Class | Description |
---|---|
A glob pattern filter for metrics.
|
|
A regex pattern filter for metrics
|
正則表達.
Fields inherited from class org.apache.hadoop.metrics2.filter.AbstractPatternFilter
EXCLUDE_KEY, EXCLUDE_TAGS_KEY, INCLUDE_KEY, INCLUDE_TAGS_KEY
透過正則表達 可以限制某些metrics 監控項的採集等等.
到這裡問題基本就解決了.
我列出來我的配置的監控項做個示例:
more hadoop-metrics2-hbase.properties
hbase.sink.file-all.class=org.apache.hadoop.metrics2.sink.FileSink
hbase.sink.file-all.filename=all.metrics
############################################################
*.period=10
*.sink.ganglia.period=10
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31
*.source.filter.class=org.apache.hadoop.metrics2.filter.RegexFilter
*.record.filter.class=${*.source.filter.class}
*.metric.filter.class=${*.source.filter.class}
hbase.sink.ganglia.metric.filter.exclude=.*_(max|min|mean|median|percentile)
hbase.sink.ganglia.record.filter.exclude=Regions
hbase.sink.ganglia.source.filter.exclude=.*Regions.*
hbase.sink.ganglia.period=10
hbase.sink.ganglia.servers=gangliaserver:8649
more hadoop-metrics2.properties
################################################
*.period=10
*.sink.ganglia.period=10
*.sink.ganglia.class=org.apache.hadoop.metrics2.sink.ganglia.GangliaSink31
*.source.filter.class=org.apache.hadoop.metrics2.filter.RegexFilter
*.record.filter.class=${*.source.filter.class}
*.metric.filter.class=${*.source.filter.class}
resourcemanager.sink.ganglia.metric.filter.exclude=.*_(max|min|mean|median|percentile)
resourcemanager.sink.ganglia.source.filter.exclude=.*_(container)*
resourcemanager.sink.ganglia.record.filter.exclude=container*
resourcemanager.sink.ganglia.source.filter.exclude=*.ontainerResource.*
nodemanager.sink.ganglia.metric.filter.exclude=.*_(max|min|mean|median|percentile)
nodemanager.sink.ganglia.source.filter.exclude=.*_(container)*
#nodeemanager.sink.ganglia.record.filter.exclude=*container.*
nodeemanager.sink.ganglia.record.filter.exclude=*container*
nodemanager.sink.ganglia.source.filter.exclude=*ontainerResource*
nodemanager.sink.ganglia.source.filter.exclude=*Containers*
mrappmaster.sink.ganglia.metric.filter.exclude=.*_(max|min|mean|median|percentile)
mrappmaster.sink.ganglia.source.filter.exclude=.*_(container)*
mrappmaster.sink.ganglia.record.filter.exclude=*container.*
mrappmaster.sink.ganglia.record.filter.exclude=*container*
mrappmaster.sink.ganglia.source.filter.exclude=*ontainerResource*
jobhistoryserver.sink.ganglia.metric.filter.exclude=.*_(max|min|mean|median|percentile)
jobhistoryserver.sink.ganglia.record.filter.exclude=*container.*
jobhistoryserver.sink.ganglia.record.filter.exclude=*container*
jobhistoryserver.sink.ganglia.source.filter.exclude=*ontainerResource*
##############################################################
............. 後面的關於server 的配置部分省略.....
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/133735/viewspace-2138975/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Ganglia監控Hadoop叢集的安裝部署Hadoop
- 叢集監控工具ganglia
- Hadoop的叢集環境部署說明Hadoop
- Hadoop叢集機器的hosts檔案配置Hadoop
- Ganglia+Hadoop+Hbase監控搭建流程Hadoop
- 使用Ganglia對hadoop進行監控Hadoop
- hadoop-叢集管理(1)——配置檔案Hadoop
- redis sentinel 叢集監控 配置Redis
- 一個4節點Hadoop叢集的配置示例Hadoop
- Nginx的配置檔案說明Nginx
- Docker 的配置檔案說明Docker
- spark叢集的配置檔案Spark
- 分散式監控系統ganglia的詳細配置分散式
- Ganglia監控工具
- ganglia監控的搭建部署
- hadoop叢集搭建配置檔案優化引數Hadoop優化
- 檔案監控效能問題【BUG】
- 使用Ganglia監控SparkSpark
- web.xml檔案配置的說明WebXML
- Redis 叢集功能說明Redis
- 基於Hadoop不同版本搭建hive叢集(附配置檔案)HadoopHive
- 多個HDFS叢集的fs.defaultFS配置一樣,造成應用一直連線同一個叢集的問題分析
- Apache 配置檔案說明(轉)Apache
- Zookeeper叢集 + Kafka叢集 + KafkaOffsetMonitor 監控薦Kafka
- Ambari,hadoop的配置,管理和監控專案入門Hadoop
- 專案叢集引發的問題
- 請教個mysql叢集的問題MySql
- Nginx配置檔案詳細說明Nginx
- saltstack/saltmaster配置檔案說明(二)AST
- Redis配置檔案引數說明Redis
- oracle ocfs 叢集檔案系統新增資料檔案帶來的問題Oracle
- Hadoop叢集面試題Hadoop面試題
- Hadoop之HDFS檔案讀寫流程說明Hadoop
- CSSCAN使用說明[字符集問題]CSS
- WebServer叢集的問題WebServer
- RHEL 7特性說明(六):叢集
- [轉]Nginx 配置檔案nginx.conf的完整配置說明Nginx
- Centos7 中 Systemd 的Unit檔案配置說明CentOS