aix errpt檢視系統錯誤

wangzhensheng發表於2008-03-25
aix errpt檢視系統錯誤[@more@]

修改當前的日誌檔案
/usr/lib/errdemon -i /var/adm/ras/myerrlog
修改當前日誌檔案大小
/usr/lib/errdemon -s 28866

修改當前日誌緩衝區大小
/usr/lib/errdemon -B 20480
修改2個重複錯誤之間的間隔時間
/usr/lib/errdemon -t 50

ps -ef | grep errdemon

/usr/lib/errdemon

/usr/lib/errstop
ps -ef | grep errdemon

errpt | more

詳細
errpt -a | pg

以ASCII 方式顯示


errpt -g -j 74533D1A | more

檢查過去24小時內發生的錯誤日誌
date

errpt -a -s 0128092102

errclear 命令清除日誌記錄
刪除所有日誌
errclear 0

刪除10天前的軟體記錄
errclear -d -S 10


===================================================

AIX errpt 命令使用備查

修改當前的日誌檔案
/usr/lib/errdemon -i /var/adm/ras/myerrlog
修改當前日誌檔案大小
/usr/lib/errdemon -s 28866

修改當前日誌緩衝區大小
/usr/lib/errdemon -B 20480
修改2個重複錯誤之間的間隔時間
/usr/lib/errdemon -t 50

ps -ef | grep errdemon

/usr/lib/errdemon

/usr/lib/errstop
ps -ef | grep errdemon

errpt | more

詳細
errpt -a | pg

以ASCII 方式顯示


errpt -g -j 74533D1A | more

檢查過去24小時內發生的錯誤日誌
date

errpt -a -s 0128092102

errclear 命令清除日誌記錄
刪除所有日誌
errclear 0

刪除10天前的軟體記錄
errclear -d -S 10

======================

errpt -a

-a是以詳細格式顯示錯誤日資檔案中的錯誤資訊


===============================================

關於“aix errpt輸出報告解析”這篇文章,我認很有學習的必要。於是就拿出來與大家分享.如果這篇“aix errpt輸出報告解析”有侵僅行為,請聯絡管理員,以便及時刪除!希望大家能夠從“aix errpt輸出報告解析”這篇文章中仔細學習並加以消化。

根據錯誤的型別,errpt -a 報告可能包含下列資訊:

LABEL 事件的預定義名稱
IDENTIFIER 事件的數字識別符號
Date/Time 事件的日期和時間
Sequence Number 事件的唯一編號
Machine ID 系統處理器部件的標識號
Node ID 系統的縮寫名(助記名)
Class 錯誤的一般原因。可能的錯誤型別有:
H 硬體
S 軟體
O 指示性資訊
U 未確定的
Type 發生的錯誤的嚴重性。可能有如下錯誤型別:
PEND 一個裝置或部件將很快喪失其可用性
PERF 裝置或部件的效能已降級至可接受的水平以下
PERM 不可能恢復的狀況。此類錯誤通常是最嚴重的錯誤,並可能意味著硬體裝置或軟體模組損壞。
除 PERM 之外的錯誤型別通常不代表一個故障,但可透過診斷程式進行分析。
TEMP 多次不成功的嘗試之後,被恢復的狀況。此錯誤型別也用來記錄指示性的資訊條目,如 DASD 裝置的資料傳輸統計。
UNKN 不能確定錯誤的嚴重性
INFO 指示性的錯誤日誌條目,和不是錯誤的結果
Resource Name 發現錯誤的資源名稱。對於軟體錯誤,這是一個軟體部件、或一個可執行程式的名稱。對於硬體錯誤,這是一個裝置、
或系統部件的名稱。這不表示部件故障、或需要替換。相反,可用來確定用來分析錯誤的適當診斷模組。
Resource Class 發現故障的資源通用類。(如,disk 裝置類)
Resource Type 發現故障的資源型別
Location Code 裝置的路徑。可能有多達四個欄位,分別涉及 drawer(抽屜)、slot(插槽)、connector(聯結器)、port(埠)。
VPD 關鍵產品資料(Vital product data)。該欄位的內容是多種多樣的。裝置的錯誤日誌條目比較典型地,
返回關於裝置廠商、序列號、工程變動級別、只讀儲存器級別等方面的資訊。
Description 錯誤的摘要
Probable Cause 列出一些可能導致錯誤的原因
User Causes 列出一些使用者誤操作導致故障的可能原因。
不正確地插入的磁碟和外部裝置(如 modems 和 prints)不能被開啟,就是使用者導致錯誤的例子。
Actions 描述校正使用者導致的錯誤的推薦操作
Install Causes 列出由於不正確的安裝或配置過程而導致故障的可能性原因。
此類錯誤的例子包含:硬體和軟體不匹配、電纜或線纜連線不正確而鬆動、不正確地配置系統。
Actions 描述校正安裝導致錯誤的推薦操作
Failure Causes 列出硬體、或軟體可能的缺陷/故障(defect)
Actions 描述校正故障的推薦操作。對於硬體錯誤,會執行診斷程式。
Detailed Data 對於每一個錯誤日誌條目都是唯一的故障資料,如裝置 sense 資料。

比如:
# errpt -aj 4B219AEA|more
---------------------------------------------------------------------------
LABEL: LVM_GS_CHILDGONE
IDENTIFIER: 4B219AEA
Date/Time: Wed Dec 5 18:12:31 BEIST 2007
Sequence Number: 1917
Machine Id: 00028057D600
Node Id: localhost
Class: U
Type: PERM
Resource Name: LIBLVM
Resource Class: NONE
Resource Type: NONE
Location:
VPD:
Description
Concurrent LVM daemon forced Volume Group offline

Probable Causes
Unrecoverable event detected by Concurrent LVM daemon
Failure Causes
Lost communication with remote nodes
Lost quorum
Recommended Actions
Ensure Cluster daemons are running
CHECK ERROR LOG FOR ADDITIONAL RELATED ENTRIES
Attempt to bring the Concurrent Volume Group back online
IF PROBLEM PERSISTS, CONTACT APPROPRIATE SERVICE REPRESENTATIVE
Detail Data
Volume Group ID
0001 CCCD 0000 D600 0000 0114 16BE 3BDC
MAJOR/MINOR DEVICE NUMBER
0000 0000
SENSE DATA
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
Duplicates
Number of duplicates
1
Time of first duplicate
Wed Dec 5 08:48:00 BEIST 2007
Time of last duplicate
Wed Dec 5 08:48:17 BEIST 2007

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8806316/viewspace-1001431/,如需轉載,請註明出處,否則將追究法律責任。

相關文章