【伺服器資料恢復】多次異常斷電後儲存執行中突然崩潰的資料恢復

北亞資料恢復發表於2023-03-31

伺服器資料恢復環境&故障:

某公司一臺儲存裝置存放公司內部重要檔案。儲存裝置上有一組由6塊硬碟組成的raid5磁碟陣列。儲存裝置在正常執行過程中

突然崩潰,管理員強制重啟後無法找到儲存裝置,多次重啟後還是找不到儲存裝置。


伺服器故障分析:

經過資料恢復工程師和硬體工程師團隊的檢測和分析,初步判斷這臺儲存裝置故障原因應該是raid模組損壞。raid模組損壞故

障包括raid資訊丟失和raid模組硬體損壞。基於以往大量的案例經驗,北亞企安資料恢復工程師團隊判斷該儲存裝置故障極有

可能就是裝置多次異常斷電導致的。經過與使用者方管理員的溝通得知這臺儲存在出現故障之前確實遭遇過數次非正常的斷電關

機,但每次斷電後重啟一切正常,因此未引起管理員的注意。即使儲存裝置崩潰後也沒有意識到這次故障與以前裝置多次異常

斷電有關係。


伺服器資料恢復過程:

1、由硬體工程師對故障儲存中所有硬碟做物理故障檢測,經過檢測沒有發現所有硬碟都可以正常讀取,不存在物理故障。

2、將所有硬碟以只讀方式做完整映象備份,後續的資料分析和資料恢復操作都基於映象檔案進行,避免在資料恢復過程中對

原始資料造成二次破壞。

3、基於映象檔案分析故障儲存中的raid5磁碟陣列的raid結構,獲取所有硬碟在陣列中的盤序、校驗方式和資料塊大小等raid

相關資訊。利用這些raid相關重新構建一組raid5陣列。

4、對重構的raid5陣列進行邏輯校驗,邏輯校驗成功後讓使用者方工程師親自進行資料驗證。

5、經過使用者方工程師的反覆驗證,沒有發現任何問題,確認恢復出來的資料完整可用,使用者方對資料恢復結果十分滿意,本

次資料恢復任務完成。


伺服器資料安全Tips:

1、伺服器和儲存裝置所在的機房應該儘量保障電源供應的穩定,如果有裝置確實需要關機,一定要使用正確的關機方法關機

,而不是直接斷電。

2、使用年限比較長的一些老裝置要經常檢查,尤其是對“受過傷害”但依舊在執行的裝置格外留意,隨時注意其工作狀態,

發現問題及時處理。例如本案例中的儲存裝置,多次異常斷電後並沒有馬上出現故障而是執行了一段時間後才突然崩潰。

3、做好資料備份,有了備份檔案,就算是裝置崩潰了也可以儘量減少損失,降低對正常業務的影響。



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2942950/,如需轉載,請註明出處,否則將追究法律責任。

相關文章