AIX系統故障處理
系統不能啟動
系統停在Stage 1 可能為電源系統板CPU 內存等硬體故障記錄故障代
碼通知IBM工程師
系統停在Stage 2 可能是啟動順序表(bootlist)損壞或I/O子系統故障可嘗試進入SMS 選單檢查啟動順序表並修改若在選擇bootlist時沒有硬碟裝置可選或顯示的硬碟資訊不正確則可能是硬碟故障若根本沒有SCSI裝置可選則鏈路有問題
系統停在Stage3 可能是硬碟資料損壞系統設定檔案出錯或I/O子系統故障
.系統停在551 555或557
發生在系統啟動的第三階段 (Stage 3) 可能是
檔案系統損壞
檔案系統日志(jfslog)損壞
rootvg中有壞硬碟
修復方法
用系統光盤或系統備份帶啟動必須與硬碟中的作業系統版本一致
啟動後選擇選項3
"Start Maintenance Mode for System Recovery"
> "Access a Root Volume Group"
> "Access this volume group and start a shell
before mounting the file systems"
格式化檔案系統日志(jfslog)
# /usr/sbin/logform /dev/hd8
檢查修復檔案系統
# fsck -y /dev/hd1 /home 檔案系統
# fsck -y /dev/hd2 /usr 檔案系統
# fsck -y /dev/hd3 /tmp 檔案系統
# fsck -y /dev/hd4 / 檔案系統
# fsck -y /dev/hd9var /var 檔案系統
... ...
用 exit 命令退出檔案系統會自動 mount 起來
重建bootimage
# lslv -m hd5 找出bootimage所在的硬碟如hdisk0
# bosboot -ad /dev/hdisk0
# bootlist -m normal /dev/hdisk0 重建啟動順序表
重啟動系統
# shutdown -Fr
如上述步驟不奏效
用系統備份帶恢復系統
如備份帶不能恢複用診斷光盤Diagnostic CDROM 檢查是否壞硬碟
.系統dump
發生在系統崩潰時AIX會做dump(系統內存的快照)
此時機器會顯示閃動的888 102 xxx 0cx 程式碼
不要關電和按reset, 等待dump做完
一般dump是由於軟體出錯引起(888-102-207 除外) 機器通常可以重啟重啟
時可能提示使用者插入磁帶複製dump檔案不要選擇退出這樣會丟失重要的故障信
息
dump的有關設定
估算系統dump的大小在系統最繁忙時內存使用最多
# sysdumpdev -e
0453-041 Estimated dump size in bytes: 53477376
# lsps -a
Page Space Physical Volume Volume Group Size %Used Active
paging00 hdisk0 rootvg 480MB 1 yes
hd6 hdisk1 rootvg 544MB 1 yes
當前的設定
#sysdumpdev -l
primary /dev/hd6 的主裝置
secondary /dev/sysdumpnull
copy directory /var/adm/ras 複製的目錄
forced copy flag TRUE
always allow dump TRUE
hd6應比估算值稍大
/var/adm/ras 是預設的dump複製目錄比較估算值保證/var檔案系統有足夠的
剩餘空間複製dump檔案否則機器重起時會提示使用者插入磁帶
dump檔名為vmcore.#
對PCI機型如要手動做dump 須把" always allow dump" 先設成true
# sysdumpdev -K
dump打包
# snap -a -o /dev/rmt# 或
# snap -a -c 把/tmp/ibmsupt目錄做成一個壓縮檔案
snap.tar.Z如果/tmp檔案系統空間不夠
可用-d directory 引數指定別的目錄代
替/tmp/ibmsupt
[@more@]來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7507082/viewspace-846246/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 統信UOS系統常見故障及處理方法
- 系統故障解析:Windows異常處理流程(轉)Windows
- 資料中心儲存系統故障的處理方式
- 銀河麒麟系統部署keepalived.故障處理
- 銀河麒麟系統安裝mongodb副本集故障處理MongoDB
- Oracle資料庫系統緊急故障處理方法(轉)Oracle資料庫
- 【故障處理】一次RAC故障處理過程
- MongoDB故障處理MongoDB
- 故障分析 | Greenplum Segment 故障處理
- GPON網路故障如何處理?GPON網路故障處理流程
- 【故障處理】ORA-600:[13013],[5001]故障處理
- 【故障處理】ORA- 2730*,status 12故障分析與處理
- linux故障處理Linux
- ora-故障處理
- WindowsXP系統搜尋故障及處理辦法點點通(轉)Windows
- 線上故障處理手冊
- MySQL show processlist故障處理MySql
- 微服務的故障處理微服務
- teams登入故障處理
- Oracle更新Opatch故障處理Oracle
- 如何快速處理線上故障
- Mysql故障處理2則MySql
- dataguard故障處理一則
- 【Linux】 nfs 故障處理LinuxNFS
- H3C運維審計系統故障處理手冊(筆記)運維筆記
- 麒麟系統修改網路卡名步驟和網路卡佔用故障處理
- aix系統資料庫sqlplus登陸報錯處理一例AI資料庫SQL
- 【故障處理】CRS-1153錯誤處理
- 【故障處理】ORA-19809錯誤處理
- undo表空間故障處理
- flash_recovery_area故障處理
- 一次dataguard故障處理
- 分散式事務故障處理分散式
- 【故障處理】因AIX非同步IO沒有開啟導致SQL*Plus不可用AI非同步SQL
- 【故障處理】ORA-12162 錯誤的處理
- aix系統vgAI
- 【故障處理】解決Linux系統、Vi、SQLPlus、PuTTY“中文亂碼”問題LinuxSQL
- Oracle 10g RAC故障處理Oracle 10g