關於Oracle 12c的叢集監控(CHM)
正常情況下,我們有很多工具來監控oracle叢集,但是Oracle更建議使用OEM來監視Oracle叢集的日常運維工作,使用Cluster Health Monitor (CHM)來監控完整的技術架構,包括作業系統的監控,為確保整個oracle叢集健康執行。在預設情況下,oracle強烈建議啟用這兩種工具,比使用他們。
關於CHM,是12c新引入的,本文主要講述CHM對叢集的監控。
Cluster Health Monitor (CHM)實時檢測和分析作業系統和叢集資源相關問題和故障,這些資訊會儲存在Oracle的網格基礎架構管理資訊庫裡面(關於Oracle Grid Infrastructure Management Repository database後面會介紹),可以事後分析問題,或者尋求Oracle Support支援的時候,提供這些資訊。
下面詳細說明CHM相關資訊:
1 CHM服務
CHM包括以下三個服務:
1、System Monitor Service
2、Cluster Logger Service
3、Oracle Grid Infrastructure Management Repository
1.1系統監視服務(System Monitor Service)
在叢集的每個節點上都存在一個系統監視服務,該系統監控服務(osysmond)實時的監控和收集叢集資訊和作業系統相關各項指標,並把這些資訊傳送給叢集日誌服務(Cluster Logger Service),然後由叢集日誌服務把採集到的資訊儲存到網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)裡面去
1.2叢集日誌服務(Cluster Logger Service)
在一個叢集裡面,每32個節點會存在一個叢集日誌服務cluster logger service (OLOGGERD),每多32節點會多產生一個OLOGGERD(可以是hub或者leaf節點),如果該服務失敗(因為一個該服務程式同時只能執行在叢集中的一個節點上,有可能該節點故障),則oracle會在其他正常的節點上啟動一個OLOGGERD程式服務。由該服務來管理網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)。
1.3網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)
關於網格基礎架構管理資訊庫的相關說明和描述如下:
1、它是一個用來儲存叢集和作業系統實時監控指標的資料庫,可以透過在安裝或者升級到12c的過程中來配置他,在12.1.0.1版本中,是一個可選項,但是在12.1.0.2以後的版本中,變成了預設的,必選項。
2、該資料庫例項在叢集的其中一個上執行,在節點故障的時候,能切換到叢集中的其他節點繼續執行,可以理解為該例項在整個叢集中是以HA的模式存在。
3、任何叢集內部服務(例如OLOGGERD和OCLUMON)都是同步private網路通訊,網格基礎架構管理資訊庫同外部客戶端連線只能透過public網路。
4、網格基礎架構管理資訊庫是一個資料庫,那麼就存在資料檔案,這些資料檔案預設放在ocr和voting一起的asm磁碟組中。
5、該資料庫預設裝完grid後既存在,預設資料庫名mgmtdb,可以類似於普通資料庫去管理,啟停,檢視狀態等等,但是在當前情況下一般不需要單獨為該資料進行備份,檢視狀態如下
$ crsctl stat res –t
……
ora.mgmtdb
1 ONLINE ONLINE node1 Open,STABLE
……
2 採集CHM資料
進行診斷資訊資料採集要確保cluster logger service必須是執行狀態
1、 執行以下命令確認cluster logger service是否執行以及執行在哪個節點下
$ Grid_home/bin/oclumon manage -get master
例如:
$oclumon manage -get master
Master = node1
# Grid_home/bin/diagcollection.pl --collect
例如:
[root@node2 chm]# /u01/app/12.1.0.2/grid/bin/diagcollection.pl --collect
Production Copyright 2004, 2010, Oracle. All rights reserved
Cluster Ready Services (CRS) diagnostic collection tool
ORACLE_BASE is /u01/app/grid
The following CRS diagnostic archives will be created in the local directory.
crsData_node2_20150705_1320.tar.gz -> logs,traces and cores from CRS home. Note: core files will be packaged only with the --core option.
baseData_node2_20150705_1320.tar.gz -> logs,traces and cores from Oracle Base. Note: core files will be packaged only with the --core option.
ocrData_node2_20150705_1320.tar.gz -> ocrdump, ocrcheck etc
coreData_node2_20150705_1320.tar.gz -> contents of CRS core files in text format
osData_node2_20150705_1320.tar.gz -> logs from Operating System
lsInventory_node2_20150705_1320 ->Opatch lsinventory details
Collecting crs data
Collecting Oracle base data
Collecting OCR data
Collecting information from core files
No corefiles found
Collecting lsinventory details
The following diagnostic archives will be created in the local directory.
acfsData_node2_20150705_1320.tar.gz -> logs from acfs log.
Collecting acfs data
Collecting OS logs
Collecting sysconfig data
會在當前目錄下生成類似以下檔案:
acfsData_node2_20150705_1320.tar.gz crsData_node2_20150705_1320.tar.gz ocrData_node2_20150705_1320.tar.gz sysconfig_node2_20150705_1320.txtbaseData_node2_20150705_1320.tar.gz lsInventory_node2_20150705_1320 osData_node2_20150705_1320.tar.gz
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24585765/viewspace-2154958/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Oracle 12c叢集啟動故障Oracle
- 基於 ZooKeeper 實現爬蟲叢集的監控爬蟲
- Redis安裝+叢集+效能監控Redis
- ORACLE 12C 之叢集日誌位置變化Oracle
- prometheus監控k8s叢集PrometheusK8S
- 如何用Prometheus監控十萬container的Kubernetes叢集PrometheusAI
- 一文讀懂clickhouse叢集監控
- 修改/dev/shm大小造成Oracle 12c叢集啟動故障devOracle
- oracle 12C RAC 12.1.0.2 叢集日誌(cluster log)目錄Oracle
- 使用夜鶯+categraf監控redis和redis叢集Redis
- Ceph Reef(18.2.X)的內建Prometheus監控叢集Prometheus
- Kubernetes叢集部署史上最詳細(二)Prometheus監控Kubernetes叢集Prometheus
- Prometheus多叢集監控的3種方案,你選哪種?Prometheus
- 如何優雅地使用雲原生 Prometheus 監控叢集Prometheus
- Kubernetes 叢集和應用監控方案的設計與實踐
- 監控Kubernetes叢集證書過期時間的三種方案
- vivo 容器叢集監控系統架構與實踐架構
- 私有IP丟失造成Oracle 12C RAC叢集節點不能啟動Oracle
- Flutter異常監控 - 伍 | 關於異常監控框架設計的思考Flutter框架
- Oracle叢集技術 | 叢集的自啟動系列(一)Oracle
- 關於前端指令碼異常監控的思考前端指令碼
- 容器叢集監控系統架構如何對症下藥?架構
- 打造雲原生大型分散式監控系統(四): Kvass+Thanos 監控超大規模容器叢集分散式
- Oracle叢集時間同步Oracle
- ORACLE監控之OSW部署Oracle
- LSF 叢集全面監控!淺析 HPC 基於龍蜥作業系統的遷移替代解決方案作業系統
- 使用BPF監視你的Kubernetes叢集
- Oracle的三種高可用叢集方案Oracle
- 阿里雲 ACK One 多叢集管理全面升級:多叢集服務、多叢集監控、兩地三中心應用容災阿里
- 如何擴充套件單個Prometheus實現近萬Kubernetes叢集監控?套件Prometheus
- Zabbix如何監控Oracle的告警日誌Oracle
- Oracle 12c 關閉歸檔模式Oracle模式
- Oracle叢集軟體管理-新增和刪除叢集節點Oracle
- 基於Dokcer搭建Redis叢集(主從叢集)Redis
- Zabbix透過Orabbix監控OracleOracle
- 基於OkHttp的Http監控HTTP
- Oracle 11g/12c 監聽器白名單的配置Oracle
- Oracle資料庫監控和運維關注哪些方面Oracle資料庫運維