CRS 診斷資料收集:常見工具及其用法摘要 (文件 ID 1526158.1)

mosdoc發表於2016-12-13

文件內容


用途

適用範圍

詳細資訊
  遠端診斷代理 [RDA]
  OS Watcher / Cluster Health Monitor
  OS Watcher (OSW)
  Cluster Health Monitor (CHM)
  ProcWatcher
  diagcollection.pl: CRS 日誌檔案
  Cluvfy 實用程式
  通用附加資料收集
  RACcheck - RAC 配置稽核工具
  RAC 資料庫跟蹤檔案
  CRS debug 設定
  Oracle Universal Installer
  系統訊息檔案位置:
  Veritas 日誌檔案位置:

參考


適用於:

Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [發行版 10.2 到 11.2]
本文件所含資訊適用於所有平臺

用途

本文件提供了用於診斷 CRS/GRID 問題的工具的快速指南。

適用範圍

本文件的目標受眾是需要診斷 CRS/Grid Infrastructure 問題的 DBA,或者您希望事先監控叢集,以確保在遇到 CRS 問題時,能夠得到所需的從問題發生之後的診斷資訊。

詳細資訊

為了充分利用問題調查工具,應在RAC 伺服器所有節點上安裝如下工具:

預設情況下,以下工具會在 CRS/Grid 安裝時自動安裝:


此外,如下工具也非常有用:

本文件提供了有關這些工具的功能和用法的簡要概述。


遠端診斷代理 [RDA]

此工具收集安裝、配置、日誌檔案和效能資料。

有關如何下載和執行 RDA 的資訊,請參閱 Document 314422.1 Remote Diagnostic Agent (RDA) 4 - Getting Started

要使用 RDA 中的自動化全節點收集功能,請參閱 Document 359395.1 Diagnostics Agent (RDA) for RAC Cluster

要執行 RDA:
將當前目錄更改為安裝目錄。

如果 Perl 可用:
./rda.pl

如果 Perl 不可用:
./rda.sh

如果訪問 perl 時出現問題,則使用以下命令驗證 Perl 已安裝並可用:

perl -V 

檢查命令輸出,檢查 “.”(即當前目錄)是否在 @INC 部分中。

RDA 使用當前目錄中的 setup.cfg 檔案設定資料收集環境引數。如果一個伺服器上有多個例項,則可能需要針對一個非安裝時指定的例項執行 RDA。如果提供的 setup.cfg 檔案不適用於當前資料庫,則:

mv setup.cfg setup_copy_<date>.cfgbak

./rda.pl
or
./rda.sh
根據您的環境響應提示,以建立新的 setup.cfg
執行 RDA
恢復原始 setup.cfg(或驗證更改是可接受的):


mv setup.cfg setup_$ORACLE_SID_<date>.cfgbak
mv setup_copy_<date>.cfgbak setup.cfg

輸出生成在安裝步驟指定的目錄中。輸出目錄將包括一個包含所有生成檔案的 zip 檔案。該檔案就是應上載至服務請求的檔案。


 

OS Watcher / Cluster Health Monitor

這些工具旨在收集 OS 效能統計資訊。

OS Watcher (OSW)

OS Watcher (OSW) 是一組 UNIX shell 指令碼的集合,主要用於收集和歸檔作業系統和網路的統計資訊,以便為診斷效能問題提供支援。OSW 作為伺服器上的一組後臺程式執行,定期收集 OS 資料,呼叫 vmstat、netstat 和 iostat 等 Unix 實用程式。

更多詳細資訊,請參閱:
Document 301137.1 OS Watcher User Guide
Document 461053.1 OSWatcher Black Box Analyzer User Guide
Document 433472.1 OS Watcher For Windows (OSWFW) User Guide. 

可以從 osw 安裝目錄中手動收集 OS Watcher 輸出或壓縮後的輸出。 
可以從 osw 安裝目錄中手動啟動資料收集:

nohup ./startOSW.sh 15 24 &

OS Watcher 應位於 init.d 中,以確保在伺服器重新引導時自動啟動。
tarupfiles.sh 指令碼應當定期執行,以壓縮 OS watcher 資料收集輸出。應配置在 crontab 中。

Cluster Health Monitor (CHM)

在版本 11.2 中,Instantaneous Problem Detection OS Tool(IPD/OS)已經過修改並更名為 Cluster Health Monitor(CHM,叢集健康監視器)。Cluster Health Monitor 收集 OS 統計資訊(系統度量),如記憶體和交換空間的使用、程式、IO 的使用和網路相關的資料。Cluster Health Monitor 實時收集資訊且通常每秒收集一次。Cluster Health Monitor 使用 OS API 收集 OS 統計資訊,以提高效能並降低 CPU 的使用開銷。Cluster Health Monitor 在本工具所消耗資源的可接受級別限制內,收集儘可能多的系統度量和資料。

有關 CHM 的更多資訊,請參閱以下文章:

Document 1328466.1 Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)
Document 811151.1 - How to install Oracle Cluster Health Monitor (former IPD/OS) on Windows


ProcWatcher

這是一個為 Oracle 程式收集堆疊跟蹤資訊的實用程式。對於 CRS 程式,必須以 root 使用者身份執行,以擁有足夠的許可權監視 root 使用者擁有的 CRS 程式。除非專門要求,否則使用以下文件中給出的步驟進行監視時不應包括 ocssd 程式。

Procwatcher 使用者指南,請參閱:
Document 459694.1 Procwatcher: Script to Monitor and Examine Oracle and CRS Processes

啟動 Procwatcher:

./prw.sh start 2

停止 Procwatcher:

./prw.sh stop

檢查 Procwatcher 狀態:

./prw.sh stat

 


diagcollection.pl: CRS 日誌檔案

CRS 10.2 及更高版本中提供了 diagcollection.pl 指令碼。對於之前版本: Document 360926.1 提供了針對 RAC 版本 10.2 之前、10.2 及更高版本收集資料的詳細資訊。
CRS 日誌可透過執行 $CRS_HOME/bin/diagcollection.pl 指令碼(11.2 及更高版本中為 diagcollection.sh)收集。
要收集所有檔案,diagcollection 必須以 root 使用者身份執行。要成功執行 diagcollection,具體命令視版本而定。請參閱 Document 330358.1 瞭解每個版本的語法。

Unix/Linux 上的 10gR2 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs
export ORACLE_BASE=/u01/app/oracle
export HOSTNAME=racdb01
$ORA_CRS_HOME/bin/diagcollection.pl -collect

Unix/Linux 上的 11gR1 的 diagcollection.pl 命令示例:

export ORA_CRS_HOME=/u01/crs
$CRS_HOME/bin/diagcollection.pl -crshome $CRS_HOME --collect

Unix/Linux 上的 11gR2 的 diagcollection.pl 命令示例:

$GRID_HOME/bin/diagcollection.sh
$GRID_HOME/bin/diagcollection.sh --adr /tmp/collect -beforetime 20120218100000 --aftertime 20120218050000
$GRID_HOME/bin/diagcollection.sh -chmos --incidenttime 02/18/201205:00:00 --incidentduration 05:00

Windows 上的 diagcollection.pl 命令示例:

set ORACLE_HOME=D:\oracle\ora102db
set ORA_CRS_HOME=D:\oracle\ora102crs
set ORACLE_BASE=D:\oracle
%ORA_CRS_HOME%\bin\diagcollection.pl --collect

注意:在 Windows 中執行 diagcollection 前,可能需要新增 perl 至環境變數 PATH。

請檢視 Document 330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide.

執行 diagcollection 將生成四個輸出檔案,包括配置和日誌資訊:
 crsData_<hostname>.tar.gz
 ocrData_<hostname>.tar.gz
 oraData_<hostname>.tar.gz
 osData_<hostname>.tar.gz

 


Cluvfy 實用程式

CVU 是隨 Oracle Clusterware 提供的實用程式。開發此程式是為了幫助安裝和配置 Oracle Clusterware 和 RAC。CVU 將驗證配置 RAC 環境不同階段所需的所有重要元件。CVU 提供的驗證範圍很廣,從 RAC 部署的初始硬體設定到已經正常執行的叢集,涵蓋各種元件的安裝和配置的所有中間階段。命令列工具為 cluvfy。Cluvfy 是非侵入式實用程式,且不會對系統或叢集產生不利影響。

使用以下命令,驗證已安裝的 RAC 叢集的配置:

cluvfy stage -post crsinst -n all -verbose

可以從 OTN 下載 cluvfy 的最新版本:
Oracle Technology Network -> Download -> Database ->

請參閱 Document 316817.1 Cluster Verification Utility (CLUVFY) FAQ


 

通用附加資料收集

RACcheck - RAC 配置稽核工具

RACcheck 是一款 RAC 配置稽核工具,主要用於稽核 Real Application Clusters (RAC)、Oracle Clusterware (CRS)、Automatic Storage Management (ASM) 和 Grid Infrastructure 環境中各個重要配置的設定。此工具稽核以下類別配置的設定:

  1. OS 核心引數
  2. OS 軟體包
  3. 其他許多對於 RAC 比較重要的 OS 配置設定。
  4. CRS/Grid Infrastructure
  5. RDBMS
  6. ASM
  7. 資料庫初始化引數
  8. 其他對 RAC 非常重要的資料庫配置
  9. 11.2.0.3 升級就緒評估

有關更多資訊,請參閱 Document 1268927.1.

RAC 資料庫跟蹤檔案

如果問題涉及資料庫,請收集以下資訊:

  • 收集問題出現期間在 $ORACLE_BASE/admin/$ORACLE_SID/bdump 中生成的所有跟蹤檔案,或資料庫告警日誌中提到的有關的所有跟蹤檔案。
  • 收集 $ORACLE_BASE/admin/$ORACLE_SID/udump 中生成的所有 SQL 跟蹤輸出

請參閱 Document 289690.1 Data Gathering for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues 瞭解詳細資訊

CRS debug 設定

以下 debug 說明僅適用於 10.2 及以上版本。

1. srvctl

要生成 srvctl 命令跟蹤資訊,應設定以下環境變數:

EXPORT SRVM_TRACE=TRUE

2. CRS/EVM/CSS 和 CRS 資源


請參閱 Document 357808.1 Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource 瞭解如何收集 CRS 元件的 debug 資訊。

Oracle Universal Installer

請參閱 Document 784667.1 What are the debugging options in OUI?

系統訊息檔案位置:

各平臺的系統日誌位於以下特定位置:

  • Linux: /var/log/messages
  • Sun: /var/adm/messages
  • HP-UX: /var/adm/syslog/syslog.log
  • Tru64: /var/adm/messages
  • AIX: /bin/errpt -a
  • Windows: 使用事件檢視器將應用程式日誌和系統日誌儲存為 .TXT 檔案,確保獲取重啟後的日誌。

Veritas 日誌檔案位置:

  • /var/VRTSvcs/log/engine_A.log

參考

NOTE:357808.1 - Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource
NOTE:359395.1 - Remote Diagnostic Agent (RDA) - RAC Cluster Guide
NOTE:433472.1 - OS Watcher For Windows (OSWFW) User Guide
NOTE:459694.1 - Procwatcher: Script to Monitor and Examine Oracle DB and Clusterware Processes
NOTE:784667.1 - What are the debugging options in Oracle Universal Installer?
NOTE:135714.1 - Script to Collect RAC Diagnostic Information (racdiag.sql)
NOTE:1328466.1 - Cluster Health Monitor (CHM) FAQ
NOTE:330358.1 - Oracle Clusterware 10gR2/ 11gR1/ 11gR2/ 12cR1 Diagnostic Collection Guide
NOTE:289690.1 - Data Collection for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues
NOTE:811151.1 - How to Install Oracle Cluster Health Monitor (former IPD/OS) on Windows
NOTE:316817.1 - Cluster Verification Utility (CLUVFY) FAQ
NOTE:314422.1 - Remote Diagnostic Agent (RDA) - Getting Started
NOTE:1268927.1 - ORAchk - Health Checks for the Oracle Stack
NOTE:301137.1 - OSWatcher (Includes: [Video])

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31393455/viewspace-2130373/,如需轉載,請註明出處,否則將追究法律責任。

相關文章