CRS 診斷資料收集:常見工具及其用法摘要 (文件 ID 1526158.1)
文件內容
|
用途 |
|
適用範圍 |
|
詳細資訊 |
遠端診斷代理 [RDA] |
OS Watcher / Cluster Health Monitor |
OS Watcher (OSW) |
Cluster Health Monitor (CHM) |
ProcWatcher |
diagcollection.pl: CRS 日誌檔案 |
Cluvfy 實用程式 |
通用附加資料收集 |
RACcheck - RAC 配置稽核工具 |
RAC 資料庫跟蹤檔案 |
CRS debug 設定 |
Oracle Universal Installer |
系統訊息檔案位置: |
Veritas 日誌檔案位置: |
|
參考 |
適用於:
Oracle Database - Enterprise Edition - 版本 10.2.0.1 到 11.2.0.3 [發行版 10.2 到 11.2]本文件所含資訊適用於所有平臺
用途
本文件提供了用於診斷 CRS/GRID 問題的工具的快速指南。
適用範圍
本文件的目標受眾是需要診斷 CRS/Grid Infrastructure 問題的 DBA,或者您希望事先監控叢集,以確保在遇到 CRS 問題時,能夠得到所需的從問題發生之後的診斷資訊。
詳細資訊
為了充分利用問題調查工具,應在RAC 伺服器所有節點上安裝如下工具:
預設情況下,以下工具會在 CRS/Grid 安裝時自動安裝:
- diagcollection.pl (10gR2 及更高版本)
- Cluvfy utility
此外,如下工具也非常有用:
本文件提供了有關這些工具的功能和用法的簡要概述。
遠端診斷代理 [RDA]
此工具收集安裝、配置、日誌檔案和效能資料。
有關如何下載和執行 RDA 的資訊,請參閱 Document 314422.1 Remote Diagnostic Agent (RDA) 4 - Getting Started
要使用 RDA 中的自動化全節點收集功能,請參閱 Document 359395.1 Diagnostics Agent (RDA) for RAC Cluster
要執行 RDA:
將當前目錄更改為安裝目錄。
./rda.pl
如果 Perl 不可用:
./rda.sh
如果訪問 perl 時出現問題,則使用以下命令驗證 Perl 已安裝並可用:
檢查命令輸出,檢查 “.”(即當前目錄)是否在 @INC 部分中。
RDA 使用當前目錄中的 setup.cfg 檔案設定資料收集環境引數。如果一個伺服器上有多個例項,則可能需要針對一個非安裝時指定的例項執行 RDA。如果提供的 setup.cfg 檔案不適用於當前資料庫,則:
./rda.pl
or
./rda.sh
根據您的環境響應提示,以建立新的 setup.cfg
執行 RDA
恢復原始 setup.cfg(或驗證更改是可接受的):
mv setup.cfg setup_$ORACLE_SID_<date>.cfgbak
mv setup_copy_<date>.cfgbak setup.cfg
輸出生成在安裝步驟指定的目錄中。輸出目錄將包括一個包含所有生成檔案的 zip 檔案。該檔案就是應上載至服務請求的檔案。
OS Watcher / Cluster Health Monitor
這些工具旨在收集 OS 效能統計資訊。
OS Watcher (OSW)
OS Watcher (OSW) 是一組 UNIX shell
指令碼的集合,主要用於收集和歸檔作業系統和網路的統計資訊,以便為診斷效能問題提供支援。OSW 作為伺服器上的一組後臺程式執行,定期收集 OS
資料,呼叫 vmstat、netstat 和 iostat 等 Unix 實用程式。
更多詳細資訊,請參閱:
Document 301137.1 OS Watcher User Guide
Document 461053.1 OSWatcher Black Box Analyzer User Guide
Document 433472.1 OS Watcher For Windows (OSWFW) User Guide.
可以從 osw 安裝目錄中手動收集 OS Watcher 輸出或壓縮後的輸出。
可以從 osw 安裝目錄中手動啟動資料收集:
OS Watcher 應位於 init.d 中,以確保在伺服器重新引導時自動啟動。
tarupfiles.sh 指令碼應當定期執行,以壓縮 OS watcher 資料收集輸出。應配置在 crontab 中。
Cluster Health Monitor (CHM)
在版本 11.2 中,Instantaneous Problem Detection OS Tool(IPD/OS)已經過修改並更名為 Cluster Health Monitor(CHM,叢集健康監視器)。Cluster Health Monitor 收集 OS 統計資訊(系統度量),如記憶體和交換空間的使用、程式、IO 的使用和網路相關的資料。Cluster Health Monitor 實時收集資訊且通常每秒收集一次。Cluster Health Monitor 使用 OS API 收集 OS 統計資訊,以提高效能並降低 CPU 的使用開銷。Cluster Health Monitor 在本工具所消耗資源的可接受級別限制內,收集儘可能多的系統度量和資料。
有關 CHM 的更多資訊,請參閱以下文章:
Document 1328466.1 Cluster Health Monitor (CHM) FAQ (Doc ID 1328466.1)
Document 811151.1 - How to install Oracle Cluster Health Monitor (former IPD/OS) on Windows
ProcWatcher
這是一個為 Oracle 程式收集堆疊跟蹤資訊的實用程式。對於 CRS 程式,必須以 root 使用者身份執行,以擁有足夠的許可權監視 root 使用者擁有的 CRS 程式。除非專門要求,否則使用以下文件中給出的步驟進行監視時不應包括 ocssd 程式。
Procwatcher 使用者指南,請參閱:
Document 459694.1 Procwatcher: Script to Monitor and Examine Oracle and CRS Processes
啟動 Procwatcher:
停止 Procwatcher:
檢查 Procwatcher 狀態:
diagcollection.pl: CRS 日誌檔案
CRS 10.2 及更高版本中提供了 diagcollection.pl 指令碼。對於之前版本: Document 360926.1 提供了針對 RAC 版本 10.2 之前、10.2 及更高版本收集資料的詳細資訊。
CRS 日誌可透過執行 $CRS_HOME/bin/diagcollection.pl 指令碼(11.2 及更高版本中為 diagcollection.sh)收集。
要收集所有檔案,diagcollection 必須以 root 使用者身份執行。要成功執行 diagcollection,具體命令視版本而定。請參閱 Document 330358.1 瞭解每個版本的語法。
Unix/Linux 上的 10gR2 的 diagcollection.pl 命令示例:
export ORACLE_BASE=/u01/app/oracle
export HOSTNAME=racdb01
$ORA_CRS_HOME/bin/diagcollection.pl -collect
Unix/Linux 上的 11gR1 的 diagcollection.pl 命令示例:
$CRS_HOME/bin/diagcollection.pl -crshome $CRS_HOME --collect
Unix/Linux 上的 11gR2 的 diagcollection.pl 命令示例:
$GRID_HOME/bin/diagcollection.sh --adr /tmp/collect -beforetime 20120218100000 --aftertime 20120218050000
$GRID_HOME/bin/diagcollection.sh -chmos --incidenttime 02/18/201205:00:00 --incidentduration 05:00
Windows 上的 diagcollection.pl 命令示例:
set ORA_CRS_HOME=D:\oracle\ora102crs
set ORACLE_BASE=D:\oracle
%ORA_CRS_HOME%\bin\diagcollection.pl --collect
注意:在 Windows 中執行 diagcollection 前,可能需要新增 perl 至環境變數 PATH。
請檢視 Document 330358.1 - CRS 10gR2/ 11gR1/ 11gR2 Diagnostic Collection Guide.
執行 diagcollection 將生成四個輸出檔案,包括配置和日誌資訊:
crsData_<hostname>.tar.gz
ocrData_<hostname>.tar.gz
oraData_<hostname>.tar.gz
osData_<hostname>.tar.gz
Cluvfy 實用程式
CVU 是隨 Oracle Clusterware 提供的實用程式。開發此程式是為了幫助安裝和配置 Oracle Clusterware 和
RAC。CVU 將驗證配置 RAC 環境不同階段所需的所有重要元件。CVU 提供的驗證範圍很廣,從 RAC
部署的初始硬體設定到已經正常執行的叢集,涵蓋各種元件的安裝和配置的所有中間階段。命令列工具為 cluvfy。Cluvfy
是非侵入式實用程式,且不會對系統或叢集產生不利影響。
使用以下命令,驗證已安裝的 RAC 叢集的配置:
可以從 OTN 下載 cluvfy 的最新版本:
Oracle Technology Network -> Download -> Database ->
請參閱 Document 316817.1 Cluster Verification Utility (CLUVFY) FAQ
通用附加資料收集
RACcheck - RAC 配置稽核工具
RACcheck 是一款 RAC 配置稽核工具,主要用於稽核 Real Application Clusters (RAC)、Oracle Clusterware (CRS)、Automatic Storage Management (ASM) 和 Grid Infrastructure 環境中各個重要配置的設定。此工具稽核以下類別配置的設定:
- OS 核心引數
- OS 軟體包
- 其他許多對於 RAC 比較重要的 OS 配置設定。
- CRS/Grid Infrastructure
- RDBMS
- ASM
- 資料庫初始化引數
- 其他對 RAC 非常重要的資料庫配置
- 11.2.0.3 升級就緒評估
有關更多資訊,請參閱 Document 1268927.1.
RAC 資料庫跟蹤檔案
如果問題涉及資料庫,請收集以下資訊:
- 收集問題出現期間在 $ORACLE_BASE/admin/$ORACLE_SID/bdump 中生成的所有跟蹤檔案,或資料庫告警日誌中提到的有關的所有跟蹤檔案。
- 收集 $ORACLE_BASE/admin/$ORACLE_SID/udump 中生成的所有 SQL 跟蹤輸出
請參閱 Document 289690.1 Data Gathering for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues 瞭解詳細資訊
CRS debug 設定
以下 debug 說明僅適用於 10.2 及以上版本。
1. srvctl
要生成 srvctl 命令跟蹤資訊,應設定以下環境變數:
2. CRS/EVM/CSS 和 CRS 資源
請參閱 Document 357808.1 Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and Resource 瞭解如何收集 CRS 元件的 debug 資訊。
Oracle Universal Installer
請參閱 Document 784667.1 What are the debugging options in OUI?
系統訊息檔案位置:
各平臺的系統日誌位於以下特定位置:
- Linux: /var/log/messages
- Sun: /var/adm/messages
- HP-UX: /var/adm/syslog/syslog.log
- Tru64: /var/adm/messages
- AIX: /bin/errpt -a
- Windows: 使用事件檢視器將應用程式日誌和系統日誌儲存為 .TXT 檔案,確保獲取重啟後的日誌。
Veritas 日誌檔案位置:
- /var/VRTSvcs/log/engine_A.log
參考
NOTE:357808.1 - Diagnosability for Oracle Clusterware (CRS or Grid Infrastructure) Component and ResourceNOTE:359395.1 - Remote Diagnostic Agent (RDA) - RAC Cluster Guide
NOTE:433472.1 - OS Watcher For Windows (OSWFW) User Guide
NOTE:459694.1 - Procwatcher: Script to Monitor and Examine Oracle DB and Clusterware Processes
NOTE:784667.1 - What are the debugging options in Oracle Universal Installer?
NOTE:135714.1 - Script to Collect RAC Diagnostic Information (racdiag.sql)
NOTE:1328466.1 - Cluster Health Monitor (CHM) FAQ
NOTE:330358.1 - Oracle Clusterware 10gR2/ 11gR1/ 11gR2/ 12cR1 Diagnostic Collection Guide
NOTE:289690.1 - Data Collection for Troubleshooting Oracle Clusterware (CRS or GI) And Real Application Cluster (RAC) Issues
NOTE:811151.1 - How to Install Oracle Cluster Health Monitor (former IPD/OS) on Windows
NOTE:316817.1 - Cluster Verification Utility (CLUVFY) FAQ
NOTE:314422.1 - Remote Diagnostic Agent (RDA) - Getting Started
NOTE:1268927.1 - ORAchk - Health Checks for the Oracle Stack
NOTE:301137.1 - OSWatcher (Includes: [Video])
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31393455/viewspace-2130373/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 收集日誌檔案同步診斷資訊指令碼(lfsdiag.sql) (文件 ID 1064487.1)指令碼SQL
- javascript中的資料型別及其常見用法JavaScript資料型別
- MYTFA(MYSQL 診斷資訊收集工具)介紹MySql
- Library Cache 診斷:Lock, Pin 以及 Load Lock (文件 ID 1548524.1)
- 資料庫異常智慧分析與診斷資料庫
- ODX 診斷資料庫轉換工具 — DDC資料庫
- Swoft 資源收集 (文件、社群、工具等)
- echo命令在Unix中的作用以及其常見用法?
- crsd.bin Fail With Error CRS-1019 When ohasd Restarted (文件 ID 2291799.1)AIErrorREST
- [JVM] 應用診斷工具之Fastthread(線上診斷)JVMASTthread
- vim常見用法
- 常見rds文件
- 5種常見的 DNS 故障診斷及問題處理方法DNS
- 常見python資料型別及其相對應的函式Python資料型別函式
- 如何選擇java診斷工具Java
- .NET Core 服務診斷工具
- 網路診斷工具的使用
- 技術分享 | MySQL Shell 收集 MySQL 診斷報告(上)MySql
- useradd 命令的常見用法
- Git SSH 命令常見用法Git
- JavaScript陣列常見用法JavaScript陣列
- nslookup命令的常見用法
- linux nc (Netcat) 常見用法Linux
- 常見資料庫資料庫
- 常見資料集
- 吃透 JVM 診斷方法與工具使用JVM
- 從監控到診斷:資料的力量
- 資料編輯方案及其工具
- 用 Arthas 神器來診斷 HBase 異常程式
- SQLNET.ORA 的常見用法SQL
- 常見的錯誤 SQL 用法SQL
- .NET Core-全域性效能診斷工具
- Part II 診斷和優化資料庫效能優化資料庫
- 大語言模型與資料庫故障診斷模型資料庫
- 【資料結構】用C語言實現單連結串列及其常見操作資料結構C語言
- 常見的Web安全及其攻防姿勢Web
- MySql三種常見引擎及其區別MySql
- axios的一些常見用法iOS
- 類别範本的常見用法