關於Oracle 12c的叢集監控(CHM)

gycixput發表於2018-05-23

    正常情況下,我們有很多工具來監控oracle叢集,但是Oracle更建議使用OEM來監視Oracle叢集的日常運維工作,使用Cluster Health Monitor (CHM)來監控完整的技術架構,包括作業系統的監控,為確保整個oracle叢集健康執行。在預設情況下,oracle強烈建議啟用這兩種工具,比使用他們。

    關於CHM,是12c新引入的,本文主要講述CHM對叢集的監控。

    Cluster Health Monitor (CHM)實時檢測和分析作業系統和叢集資源相關問題和故障,這些資訊會儲存在Oracle的網格基礎架構管理資訊庫裡面(關於Oracle Grid Infrastructure Management Repository database後面會介紹),可以事後分析問題,或者尋求Oracle Support支援的時候,提供這些資訊。

    下面詳細說明CHM相關資訊:

1  CHM服務

    CHM包括以下三個服務:

1、System Monitor Service

2、Cluster Logger Service

3、Oracle Grid Infrastructure Management Repository

 

1.1系統監視服務(System Monitor Service

    在叢集的每個節點上都存在一個系統監視服務,該系統監控服務(osysmond)實時的監控和收集叢集資訊和作業系統相關各項指標,並把這些資訊傳送給叢集日誌服務(Cluster Logger Service),然後由叢集日誌服務把採集到的資訊儲存到網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)裡面去

        

1.2叢集日誌服務(Cluster Logger Service

    在一個叢集裡面,每32個節點會存在一個叢集日誌服務cluster logger service (OLOGGERD),每多32節點會多產生一個OLOGGERD(可以是hub或者leaf節點),如果該服務失敗(因為一個該服務程式同時只能執行在叢集中的一個節點上,有可能該節點故障),則oracle會在其他正常的節點上啟動一個OLOGGERD程式服務。由該服務來管理網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database)。

 

1.3網格基礎架構管理資訊庫(Oracle Grid Infrastructure Management Repository database

    關於網格基礎架構管理資訊庫的相關說明和描述如下:
    1、它是一個用來儲存叢集和作業系統實時監控指標的資料庫,可以透過在安裝或者升級到12c的過程中來配置他,在12.1.0.1版本中,是一個可選項,但是在12.1.0.2以後的版本中,變成了預設的,必選項。
    2、
該資料庫例項在叢集的其中一個上執行,在節點故障的時候,能切換到叢集中的其他節點繼續執行,可以理解為該例項在整個叢集中是以HA的模式存在。
    3、
任何叢集內部服務(例如OLOGGERDOCLUMON)都是同步private網路通訊,網格基礎架構管理資訊庫同外部客戶端連線只能透過public網路。
    4、
網格基礎架構管理資訊庫是一個資料庫,那麼就存在資料檔案,這些資料檔案預設放在ocrvoting一起的asm磁碟組中。
    5、
該資料庫預設裝完grid後既存在,預設資料庫名mgmtdb,可以類似於普通資料庫去管理,啟停,檢視狀態等等,但是在當前情況下一般不需要單獨為該資料進行備份,檢視狀態如下


$ crsctl stat res –t

……

ora.mgmtdb

      1        ONLINE  ONLINE       node1                    Open,STABLE

……

 

採集CHM資料

    進行診斷資訊資料採集要確保cluster logger service必須是執行狀態
    1、 執行以下命令確認cluster logger service是否執行以及執行在哪個節點下

$ Grid_home/bin/oclumon manage -get master

例如:

$oclumon manage -get master

Master = node1

    2、需要有特權賬號,一般root,在一個新的目錄下,執行以下命令收集相關資訊,該命令可以在叢集的任意一個節點下執行


# Grid_home/bin/diagcollection.pl --collect

例如:

[root@node2 chm]# /u01/app/12.1.0.2/grid/bin/diagcollection.pl --collect
Production Copyright 2004, 2010, Oracle.  All rights reserved
Cluster Ready Services (CRS) diagnostic collection tool
ORACLE_BASE is /u01/app/grid
The following CRS diagnostic archives will be created in the local directory.
crsData_node2_20150705_1320.tar.gz -> logs,traces and cores from CRS home. Note: core files will be packaged only with the --core option. 
baseData_node2_20150705_1320.tar.gz -> logs,traces and cores from Oracle Base. Note: core files will be packaged only with the --core option. 
ocrData_node2_20150705_1320.tar.gz -> ocrdump, ocrcheck etc 
coreData_node2_20150705_1320.tar.gz -> contents of CRS core files in text format
 
osData_node2_20150705_1320.tar.gz -> logs from Operating System
lsInventory_node2_20150705_1320 ->Opatch lsinventory details
Collecting crs data
Collecting Oracle base data
Collecting OCR data 
Collecting information from core files
No corefiles found 
Collecting lsinventory details
The following diagnostic archives will be created in the local directory.
acfsData_node2_20150705_1320.tar.gz -> logs from acfs log.
Collecting acfs data
Collecting OS logs
Collecting sysconfig data

會在當前目錄下生成類似以下檔案:

acfsData_node2_20150705_1320.tar.gz  crsData_node2_20150705_1320.tar.gz  ocrData_node2_20150705_1320.tar.gz  sysconfig_node2_20150705_1320.txt
baseData_node2_20150705_1320.tar.gz  lsInventory_node2_20150705_1320     osData_node2_20150705_1320.tar.gz

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/24585765/viewspace-2154958/,如需轉載,請註明出處,否則將追究法律責任。

相關文章