關於Oracle 12c的叢集監控(CHM)
正常情況下,我們有很多工具來監控oracle叢集,但是Oracle更建議使用OEM來監視Oracle叢集的日常運維工作,使用Cluster Health Monitor (CHM)來監控完整的技術架構,包括作業系統的監控,為確保整個oracle叢集健康執行。在預設情況下,oracle強烈建議啟用這兩種工具,比使用他們。
關於CHM,是12c新引入的,本文主要講述CHM對叢集的監控。
Cluster Health Monitor (CHM)實時檢測和分析作業系統和叢集資源相關問題和故障,這些資訊會儲存在Oracle的網格基礎架構管理資訊庫裡面(關於Oracle Grid Infrastructure Management Repository database後面會介紹),可以事後分析問題,或者尋求Oracle Support支援的時候,提供這些資訊。
下面詳細說明CHM相關資訊:
1 CHM服務
CHM包括以下三個服務:
1、System Monitor Service
2、Cluster Logger Service
3、Oracle Grid Infrastructure Management Repository
1.1系統監視服務(System Monitor Service)
在叢集的每個節點上都存在一個系統監視服務,該系統監控服務(osysmond)實時的監控和收集叢集資訊和作業系統相關各項指標,並把這些資訊傳送給叢集日誌服務(Cluster Logger Service),然後由叢集日誌服務把採集到的資訊儲存到網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)裡面去
1.2叢集日誌服務(Cluster Logger Service)
在一個叢集裡面,每32個節點會存在一個叢集日誌服務cluster logger service (OLOGGERD),每多32節點會多產生一個OLOGGERD(可以是hub或者leaf節點),如果該服務失敗(因為一個該服務程式同時只能執行在叢集中的一個節點上,有可能該節點故障),則oracle會在其他正常的節點上啟動一個OLOGGERD程式服務。由該服務來管理網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)。
1.3網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)
關於網格基礎架構管理資訊庫的相關說明和描述如下:
1、它是一個用來儲存叢集和作業系統實時監控指標的資料庫,可以透過在安裝或者升級到12c的過程中來配置他,在12.1.0.1版本中,是一個可選項,但是在12.1.0.2以後的版本中,變成了預設的,必選項。
2、該資料庫例項在叢集的其中一個上執行,在節點故障的時候,能切換到叢集中的其他節點繼續執行,可以理解為該例項在整個叢集中是以HA的模式存在。
3、任何叢集內部服務(例如OLOGGERD和OCLUMON)都是同步private網路通訊,網格基礎架構管理資訊庫同外部客戶端連線只能透過public網路。
4、網格基礎架構管理資訊庫是一個資料庫,那麼就存在資料檔案,這些資料檔案預設放在ocr和voting一起的asm磁碟組中。
5、該資料庫預設裝完grid後既存在,預設資料庫名mgmtdb,可以類似於普通資料庫去管理,啟停,檢視狀態等等,但是在當前情況下一般不需要單獨為該資料進行備份,檢視狀態如下
$ crsctl stat res –t
……
ora.mgmtdb
1 ONLINE ONLINE node1 Open,STABLE
……
2 採集CHM資料
進行診斷資訊資料採集要確保cluster logger service必須是執行狀態
1、 執行以下命令確認cluster logger service是否執行以及執行在哪個節點下
$ Grid_home/bin/oclumon manage -get master
例如:
$oclumon manage -get master
Master = node1
# Grid_home/bin/diagcollection.pl --collect
例如:
[root@node2 chm]# /u01/app/12.1.0.2/grid/bin/diagcollection.pl --collect
Production Copyright 2004, 2010, Oracle. All rights reserved
Cluster Ready Services (CRS) diagnostic collection tool
ORACLE_BASE is /u01/app/grid
The following CRS diagnostic archives will be created in the local directory.
crsData_node2_20150705_1320.tar.gz -> logs,traces and cores from CRS home. Note: core files will be packaged only with the --core option.
baseData_node2_20150705_1320.tar.gz -> logs,traces and cores from Oracle Base. Note: core files will be packaged only with the --core option.
ocrData_node2_20150705_1320.tar.gz -> ocrdump, ocrcheck etc
coreData_node2_20150705_1320.tar.gz -> contents of CRS core files in text format
osData_node2_20150705_1320.tar.gz -> logs from Operating System
lsInventory_node2_20150705_1320 ->Opatch lsinventory details
Collecting crs data
Collecting Oracle base data
Collecting OCR data
Collecting information from core files
No corefiles found
Collecting lsinventory details
The following diagnostic archives will be created in the local directory.
acfsData_node2_20150705_1320.tar.gz -> logs from acfs log.
Collecting acfs data
Collecting OS logs
Collecting sysconfig data
會在當前目錄下生成類似以下檔案:
acfsData_node2_20150705_1320.tar.gz crsData_node2_20150705_1320.tar.gz ocrData_node2_20150705_1320.tar.gz sysconfig_node2_20150705_1320.txtbaseData_node2_20150705_1320.tar.gz lsInventory_node2_20150705_1320 osData_node2_20150705_1320.tar.gz
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24585765/viewspace-2154958/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Zookeeper叢集 + Kafka叢集 + KafkaOffsetMonitor 監控薦Kafka
- 叢集監控工具ganglia
- 基於 ZooKeeper 實現爬蟲叢集的監控爬蟲
- redis sentinel 叢集監控 配置Redis
- Redis安裝+叢集+效能監控Redis
- ORACLE EM 12C 監控MySQLOracleMySql
- Oracle 12c叢集啟動故障Oracle
- prometheus監控k8s叢集PrometheusK8S
- redis3.0叢集監控指令碼RedisS3指令碼
- Ganglia監控Hadoop叢集的安裝部署Hadoop
- 使用夜鶯+categraf監控redis和redis叢集Redis
- ORACLE 12C 叢集啟動順序圖Oracle
- 急問:關於Web容器叢集和EJB叢集Web
- 結合Ansible技術監控Storm叢集ORM
- ORACLE 12C 之叢集日誌位置變化Oracle
- 關於 “監控此主題”?
- Elasticsearch叢集監控工具bigdesk外掛安裝Elasticsearch
- Nagios監控mongodb分片叢集服務實戰iOSMongoDB
- 高效能Linux叢集管理監控之道(轉)Linux
- 關於郵件監控的問題
- 如何用Prometheus監控十萬container的Kubernetes叢集PrometheusAI
- Prometheus多叢集監控的3種方案,你選哪種?Prometheus
- Ceph Reef(18.2.X)的內建Prometheus監控叢集Prometheus
- vivo 容器叢集監控系統架構與實踐架構
- 叢集式數字監控應用模型研究(一) (轉)模型
- 將12c RAC由標準叢集改為flex叢集Flex
- Flutter異常監控 - 伍 | 關於異常監控框架設計的思考Flutter框架
- 修改/dev/shm大小造成Oracle 12c叢集啟動故障devOracle
- 關於oracle的監聽問題Oracle
- 容器叢集監控系統架構如何對症下藥?架構
- 關於Oracle RAC 叢集日誌無法輪循的問題處理Oracle
- 打造雲原生大型分散式監控系統(四): Kvass+Thanos 監控超大規模容器叢集分散式
- 關於前端指令碼異常監控的思考前端指令碼
- Oracle索引的監控Oracle索引
- oracle 12C RAC 12.1.0.2 叢集日誌(cluster log)目錄Oracle
- 監控Kubernetes叢集證書過期時間的三種方案
- Kubernetes 叢集和應用監控方案的設計與實踐
- ganglia 監控hadoop 叢集的配置檔案問題的一個說明.Hadoop