hp vg引發的資料庫故障(zt)

wmlm發表於2008-02-01
20號晚上,加完班剛到家,就接到了一個來自吉林的電話,說資料庫起不來了。 (引自一位網友的BLOG,做個備註,以後不犯此類錯誤)[@more@]

據瞭解,資料庫為920X,hp-ux,rac
據說是hpux突然找不到vg,然後hp的工程師又手工恢復了vg資訊。

但是資料啟動報錯,提示ora-201,ora-202,ora-210的意思是控制檔案和oracle不相容
出現這個問題有兩個原因:
1.compitible引數設定錯誤
2.控制檔案損壞
嘗試從spfile裡面建立pfile,結果pfile為空。進一步判斷spfile損壞了。
尋找建庫時使用pfile,啟用資料庫,錯誤一樣。分別使用不同的控制檔案,也同樣是這兩個錯誤。

因為控制檔案沒有備份,好在alert是完整的,於是從alert裡提取資料庫的檔名稱,手工建立controlfile,結果發現回滾表空間的資料檔案無法加到控制檔案中,用dbv驗證,證實這兩個檔案已經損壞了。同時損壞的還有一些其他的資料檔案。

去掉這些檔案,建立控制檔案成功,用新控制檔案啟動資料庫,open資料庫時,提示需要media recovery。因為回滾表空間已經壞了,media recovery已經變成了 mission impossible了。

因為控制檔案和回滾表空間同時損壞,這個資料庫要修復已經很難了。

能想到的就是加_corrupt_rollback_segments引數強制開啟資料庫,然後嘗試exp資料了。

因為責任原因,這個操作負責這個系統的工程師不敢嘗試。

最後oracle派了現場工程師,不過好像到目前未知,結論是一樣的。現在正在搭建臨時環境,恢復10月份的資料,並把故障庫的裸裝置進行備份,備份成功後,才能嘗試強制開啟資料庫。

事已至此,已經沒什麼說的了。不過還是要從故障為什麼發生中學到點什麼吧。
這次故障,是由於沒有給陣列劃分zone,導致某廠家(dt)的技術人員在工作時,沒有使用劃分給他的磁碟,而使用了oravg的磁碟導致的。這個vg是oracle建庫時使用的,redolog,unto、control、spfile、預設表空間等都在這個vg上。

據說這是oracle在國內遇到的最嚴重的一次故障......

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/271063/viewspace-999016/,如需轉載,請註明出處,否則將追究法律責任。

相關文章