【伺服器資料恢復】斷電導致伺服器無法進入系統的資料恢復案例

北亞資料恢復發表於2023-03-14

伺服器資料恢復環境:

某品牌ProLiant DL系列伺服器,

6塊SAS硬碟組成RAID5磁碟陣列,

WINDOWS SERVER作業系統,

儲存了企業的內部檔案。


伺服器故障&分析:

伺服器在發生故障前有過幾次意外斷電,每次斷電重啟後沒有出現異常。直到最後一次斷電重啟沒有成功,RAID報錯,提示

無法找到儲存裝置。進入RAID管理模組,執行任何操作就當機。管理員多次重啟伺服器後還是無法成功進入作業系統。

通常伺服器出現這類故障,有很大的可能性是因為意外斷電導致RAID模組損壞(RAID管理資訊丟失或RAID模組硬體損壞)

。RAID陣列建立完成後,管理模組資訊就會固定下來不會再發生變化。但是raid陣列的模組資訊畢竟不是隻讀的,也是可以

修改的,而意外斷電就可能導致模組資訊被篡改或者丟失,多次斷電甚至可能導致RAID卡元器件損壞,伺服器失去對多塊物

理硬碟進行RAID管理的中間層模組。根據本案例伺服器的故障表現,北亞企安資料恢復工程師初步判斷故障原因就是RAID

卡硬體損壞,如果是這種情況,透過常規方法無法獲取6塊磁碟中的資料。


伺服器資料恢復過程:

1、經過物理故障檢測發現故障伺服器內的所有硬碟均可以正常讀取,無物理故障。

2、編號後將故障伺服器內的所有硬碟以只讀方式進行映象備份,映象完成後將所有硬碟按照編號還原到故障伺服器中。後續

的資料分析和資料恢復操作都基於映象檔案進行,避免對原始資料造成二次破壞。

3、基於映象檔案,北亞企安資料恢復工程師分析故障伺服器中raid5磁碟陣列結構,確定raid陣列的硬碟順序、資料塊大小、

陣列校驗方式等raid相關資訊。

4、利用獲取到的raid陣列資訊虛擬重構raid陣列並進行邏輯校驗,確保重構RAID各項引數正確無誤後驗證重要資料。

5、經過資料恢復工程師驗證後沒有發現異常,讓管理員親自驗證無問題後將資料遷移到提前準備好的環境中,本次資料恢復

工作完成。


伺服器資料安全Tips:

1、儘量保證機房供電穩定,重要裝置配備UPS,以減少供電異常影響伺服器及儲存的正常工作。

2、應定期對老舊裝置進行安全檢查,評估老舊裝置的執行狀態,評估是否需要對老舊裝置進行硬體升級或者系統升級。

3、提前制定突發事件應急處理方案,以降低異常斷電帶來的損失。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2939516/,如需轉載,請註明出處,否則將追究法律責任。

相關文章