RAC磁碟頭損壞問題處理
背景:叢集當機以後,重啟報錯,DATADG1磁碟組無法啟動
1.手動掛起DATADG1磁碟組 報錯
alter diskgroup datadg1 mount
後臺ASM報錯
根據報錯 found 0 disks 懷疑 是磁碟組裡的磁碟有問題,沒有啟動
2.查詢磁碟狀態
`select name,path,STATE,MODE_STATUS from v$asm_disk;
發現磁碟都在,但是磁碟組沒法跟磁碟對應起來
3.硬體工程師檢查硬碟、以及儲存閘道器都正常,磁碟許可權也正常
4.懷疑是磁碟頭損壞了,導致磁碟組跟磁碟無法對應
select group_Number,disk_number,mount_status ,header_status from v$asm_disk;
發現2,3磁碟頭狀態為CANDIDATE
5.使用kfed檢視磁碟頭
kfed read /dev/rhdiskpower2
kfbh.type顯示異常 正常情況下應該是KFBTYP_DISKHEAD
5.修復2,3磁碟頭
<aside> ? 從版本10.2.0.5開始ASM 會對disk header做一個額外的備份。即第二AU 的倒數第二個block中備份了一份KFBTYP_DISKHEAD。這個ASM Disk header的作用是當真的KFBTYP_DISKHEAD被意外覆蓋或損壞時可以使用Oracle 工具 KFED使用repair選項來修復Disk header
</aside>
kfed repair /dev/rhdiskpower2
此時檢查 磁碟頭狀態正常,顯示為KFBTYP_DISKHEAD
6.一節點的資料庫反覆重啟
修復磁碟頭以後,磁碟能夠正常掛起,並且資料庫能夠拉起
但是資料庫在執行一段時間後 ,出現當機
資料庫日誌顯示 IO錯誤
由於作業系統為AIX,排查兩個節點的磁碟引數
lsattr -El hdisk20 | grep reserve
發現二節點並沒有設定no_reserve
這個引數的作用:這個引數其實是表示作業系統是否持有儲存卷的共享鎖方式
設定
chdev -l hdisk21 -a reserve_policy=no_reserve
設定完成後,一節點能夠正常執行
7.二節點gpnpd服務無法啟動
根據gipcd 日誌資訊
匹配到官方文件Doc ID 2034669.1
刪除以上三個目錄的快取,重啟rac,二節點啟動成功
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/23825935/viewspace-2917172/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 控制檔案損壞處理
- ASM磁碟頭資訊損壞和修復(kfed/dd)ASM
- 【LINUX】Oracle資料庫 linux磁碟頭資料損壞修復LinuxOracle資料庫
- linux下修復磁碟損壞Linux
- 面對硬碟磁頭損壞問題,資料該如何解救?硬碟
- MySQL 磁碟空間滿導致表空間相關資料檔案損壞故障處理MySql
- Ceph 磁碟損壞現象和解決方法
- Oracle asm磁碟損壞異常恢復OracleASM
- 問題:未清空磁碟被新增到磁碟組觸發壞塊
- redhat7 搭建oracle 11g RAC 問題與處理RedhatOracle
- Oracle資料庫處理壞塊問題常用命令Oracle資料庫
- 如何處理Oracle資料庫中的壞塊問題(轉)Oracle資料庫
- windows10應用商店損壞怎麼修復_win10應用商店損壞處理方法WindowsWin10
- Oracle 無備份情況下undo檔案損壞處理Oracle
- RAID10磁碟陣列損壞修復操作AI陣列
- oracle redo各種狀態(inactive、active、current)損壞的處理方式Oracle Redo
- MySQL資料庫INNODB表損壞修復處理過程分享MySql資料庫
- linux RAID10磁碟陣列損壞的修復LinuxAI陣列
- Oracle壞塊處理Oracle
- system資料檔案頭損壞修復
- 磁頭損壞的修復方法有哪些
- win10ie核心損壞怎麼修復_win10電腦ie顯示核心丟失或損壞處理方法Win10
- golang json處理問題GolangJSON
- [git] git問題處理Git
- Win10開機提示radeoninstaller.exe損壞的映像怎麼處理Win10
- Oracle Database 12c RAC損壞ocr和votedisk恢復實驗OracleDatabase
- 深入解析:段頭塊損壞bbed異常恢復
- 併發問題處理方式
- Linux 問題處理集錦Linux
- 處理SQLServer errorlog滿問題SQLServerError
- 資料處理--pandas問題
- Ubuntu處理依賴問題Ubuntu
- oracle rac 增加磁碟Oracle
- Oracle 11gr2修改RAC叢集的scan ip,並處理ORA-12514問題Oracle
- Oracle 10g RAC故障處理Oracle 10g
- PHP 開發版本問題處理PHP
- 【故障處理】TNS-04610問題
- JVM問題分析處理手冊JVM