ORA-15096: lost disk write detected的解決與修復

資料和雲發表於2021-11-19

案例背景:4節點extend rac,儲存raid 5校驗異常,修復之後SOLDATA磁碟組無法mount,報錯ORA-15096: lost disk write detected。

mount SOLDATA磁碟組ASM日誌:

檢視ora-15096的描述,官方提供的action還是比較悲觀的。

kfed讀取4個thread的acd checkpoint分別為:

  • thread 1(inst_id 2) acdc:
  • thread 2(inst_id 1) acdc:
  • thread 3(inst_id 4) acdc:
  • thread 4(inst_id 3) acdc:

報錯的trace可以看到是在做acd前滾recover的時候出現了異常,其實ora-15096錯誤的原因就是在前滾過程中,ACD block描述的後設資料塊變更與實際後設資料塊不一致導致的。

kfed讀取recover報錯的ACD BLOCK

kfed讀取recover報錯的後設資料block:

明白了來龍去脈之後修復方法有兩種:

  • 修改thread 3 acd checkpoint
  • 修改303號檔案filedir的fscn


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31556440/viewspace-2843067/,如需轉載,請註明出處,否則將追究法律責任。

相關文章