RAC磁碟頭損壞問題處理
背景:叢集當機以後,重啟報錯,DATADG1磁碟組無法啟動
1.手動掛起DATADG1磁碟組 報錯
alter diskgroup datadg1 mount
後臺ASM報錯
根據報錯 found 0 disks 懷疑 是磁碟組裡的磁碟有問題,沒有啟動
2.查詢磁碟狀態
`select name,path,STATE,MODE_STATUS from v$asm_disk;
發現磁碟都在,但是磁碟組沒法跟磁碟對應起來
3.硬體工程師檢查硬碟、以及儲存閘道器都正常,磁碟許可權也正常
4.懷疑是磁碟頭損壞了,導致磁碟組跟磁碟無法對應
select group_Number,disk_number,mount_status ,header_status from v$asm_disk;
發現2,3磁碟頭狀態為CANDIDATE
5.使用kfed檢視磁碟頭
kfed read /dev/rhdiskpower2
kfbh.type顯示異常 正常情況下應該是KFBTYP_DISKHEAD
5.修復2,3磁碟頭
<aside> ? 從版本10.2.0.5開始ASM 會對disk header做一個額外的備份。即第二AU 的倒數第二個block中備份了一份KFBTYP_DISKHEAD。這個ASM Disk header的作用是當真的KFBTYP_DISKHEAD被意外覆蓋或損壞時可以使用Oracle 工具 KFED使用repair選項來修復Disk header
</aside>
kfed repair /dev/rhdiskpower2
此時檢查 磁碟頭狀態正常,顯示為KFBTYP_DISKHEAD
6.一節點的資料庫反覆重啟
修復磁碟頭以後,磁碟能夠正常掛起,並且資料庫能夠拉起
但是資料庫在執行一段時間後 ,出現當機
資料庫日誌顯示 IO錯誤
由於作業系統為AIX,排查兩個節點的磁碟引數
lsattr -El hdisk20 | grep reserve
發現二節點並沒有設定no_reserve
這個引數的作用:這個引數其實是表示作業系統是否持有儲存卷的共享鎖方式
設定
chdev -l hdisk21 -a reserve_policy=no_reserve
設定完成後,一節點能夠正常執行
7.二節點gpnpd服務無法啟動
根據gipcd 日誌資訊
匹配到官方文件Doc ID 2034669.1
刪除以上三個目錄的快取,重啟rac,二節點啟動成功
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23825935/viewspace-2917172/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 段頭損壞的處理
- oracle10g rac 表決盤損壞、ocr損壞處理Oracle
- 11gASM磁碟頭大量損壞?ASM
- 處理塊損壞
- RAC 11G ASM磁碟損壞恢復ASM
- Oracle壞塊問題處理Oracle
- ASM磁碟頭資訊損壞和修復(kfed/dd)ASM
- AMDU 從頭部損壞的磁碟中提取檔案
- 第7章 處理塊損壞
- UNDO表空間損壞的處理
- 【資料安全】一次驚心動魄的ASM磁碟頭損壞故障處理過程帶來的深思ASM
- 面對硬碟磁頭損壞問題,資料該如何解救?硬碟
- oracle - redo 損壞或刪除處理方法Oracle
- linux下修復磁碟損壞Linux
- (轉)oracle redolog損壞的處理辦法Oracle Redo
- undo表空間損壞的處理過程
- 【LINUX】Oracle資料庫 linux磁碟頭資料損壞修復LinuxOracle資料庫
- 【故障處理】DBCA建庫詭異問題處理--rac環境不能建立rac庫
- MySQL 磁碟空間滿導致表空間相關資料檔案損壞故障處理MySql
- oracle grid 其中一個節點asm 磁碟組後設資料損壞處理案例OracleASM
- Online Redo Log損壞處理實驗(上)
- Online Redo Log損壞處理實驗(中)
- Online Redo Log損壞處理實驗(下)
- sysaux表空間檔案損壞的處理(zt)UX
- Ceph 磁碟損壞現象和解決方法
- Oracle asm磁碟損壞異常恢復OracleASM
- oracle 10g rac+asm 歸檔路徑磁碟組空間滿問題處理Oracle 10gASM
- 聯機日誌檔案損壞問題
- 關於介面返回BOM頭處理的問題
- 回滾段表空間損壞處理(ORA-01552)處理方法
- 【故障處理】通過重建資料庫物件解決因EXPDP/IMPDP工具損壞無法使用問題資料庫物件
- 處理 Oracle 塊損壞 (文件 ID 1526911.1)Oracle
- Undo和Current Online Redo損壞的處理方法
- Current online Redo 和 Undo 損壞的處理方法
- 沒有備份的情況下處理undo損壞
- windows10應用商店損壞怎麼修復_win10應用商店損壞處理方法WindowsWin10
- ORA-01578(資料塊損壞)跳過壞塊處理辦法
- 如何處理Oracle資料庫中的壞塊問題(轉)Oracle資料庫