AIX 系統errpt命令

victorymoshui發表於2011-10-26

在AIX系統中,我們經常使用errpt命令生成一個錯誤報告,並針對錯誤報告對系統進行分析。

首先可以檢視一下不帶任何引數的情況下使用errpt命令的輸出結果。

PS:errpt 命令將從錯誤日誌中的條目生成一個錯誤報告,但是它並不進行錯誤日誌分析

# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
F7FA22C9   1009173911 I O SYSJ2          UNABLE TO ALLOCATE SPACE IN FILE SYSTEM

再使用-a 引數生成一個較為詳細資訊的錯誤報告:

# errpt -a    
---------------------------------------------------------------------------
LABEL:          J2_FS_FULL
IDENTIFIER:     F7FA22C9

Date/Time:       Sun Oct  9 17:39:56 BEIST 2011
Sequence Number: 2167040
Machine Id:      0008EAA9D600
Node Id:         bill1
Class:           O
Type:            INFO
Resource Name:   SYSJ2          

Description
UNABLE TO ALLOCATE SPACE IN FILE SYSTEM

Probable Causes
FILE SYSTEM FULL

        Recommended Actions
        INCREASE THE SIZE OF THE ASSOCIATED FILE SYSTEM
        REMOVE UNNECESSARY DATA FROM FILE SYSTEM
        USE FUSER UTILITY TO LOCATE UNLINKED FILES STILL REFERENCED

Detail Data
JFS2 MAJOR/MINOR DEVICE NUMBER
000A 0006
FILE SYSTEM DEVICE AND MOUNT POINT
/dev/hd9var, /var

 

根據錯誤的型別,errpt -a 報告可能包含下面的資訊:

LABEL——事件的預定義名稱。

IDENTIFIER——事件的數值識別符號。

Date/Time——事件的日期和時間。

Sequence Number——事件的唯一編號。

Machine ID——您的系統處理器單元的標識編號。

Node ID——您的系統的助記名稱。

Class——錯誤的一般來源。可能的錯誤型別包括:

  • H——硬體。
  • S——軟體。
  • ——資訊性訊息。
  • U——未定的。

Type——所發生的錯誤的嚴重程度。可能的錯誤型別包括:

  • PEND——裝置或元件的可用性損失是急迫的。
  • PERF——裝置或元件的效能已下降到可接受的級別以下。
  • PERM——出現了不可恢復的情況。如果錯誤型別為這個值,那麼通常是最嚴重的錯誤,並且很可能意味著出現了硬體裝置或者軟體模組的故障。如果錯誤型別為 PERM 之外的其他值,通常並不表示故障,但是對這些錯誤進行了記錄,以便可以使用診斷程式對它們進行分析。
  • TEMP——在出現多次不成功的嘗試之後,所恢復到的狀態。這種錯誤型別也可以用於記錄資訊性條目,如 DASD 裝置的資料傳輸統計資訊。
  • UNKN——無法確定錯誤的嚴重程度。
  • INFO——錯誤日誌條目是資訊性的,並且不是某個錯誤所產生的結果。

Resource Name——檢測到錯誤的資源的名稱。對於軟體錯誤,這是某個軟體元件或可執行程式的名稱。對於硬體錯誤,這是某個裝置或系統元件的名稱。它並不表示該元件出現故障或者需要更換。相反,它用於確定合適的診斷模組以用於對錯誤進行分析。

Resource Class——檢測到故障的資源的一般類別(例如,磁碟的裝置類別)。

Resource Type——檢測到故障的資源的型別。

Location Code——裝置的路徑。最多可能有四個欄位,分別是抽屜、插槽、聯結器和埠。

VPD——關鍵的產品資料。這個欄位的內容(如果存在)可能各不相同。裝置的錯誤日誌條目通常返回有關裝置製造商、序列號、工程變更級別、以及只讀儲存級別的資訊。

Description——錯誤的彙總資訊。

Probable Cause——一些可能的錯誤原因的列表。

User Causes——由使用者錯誤所導致錯誤的可能原因的列表。使用者所導致的錯誤可能包括不正確插入的磁碟、未能開啟的外部裝置(如調變解調器和印表機)。

Actions——對於糾正使用者所導致的錯誤的推薦操作的描述。

Install Causes——因為不正確的安裝或者配置過程所導致錯誤的可能原因列表。這種型別的錯誤包括硬體和軟體不匹配、電纜的不正確安裝或電纜連線變鬆,以及未能正確配置的系統。

Actions——對於糾正安裝所導致的錯誤的推薦操作的描述。

Failure Causes——可能的硬體或者軟體故障列表。

Actions——對於糾正故障的推薦操作的描述。對於硬體錯誤,這將導致執行診斷程式。

Detailed Data——針對每個錯誤日誌條目的、唯一的故障資料,如裝置檢測資料。

 

注:資訊摘於《 IBM AIX V5.3系統管理(Test 222)認證指南系列,第5部分:問題的確定和解決(上)

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/9390331/viewspace-709680/,如需轉載,請註明出處,否則將追究法律責任。

相關文章