【伺服器資料恢復】意外斷電導致RAID模組資訊丟失的資料恢復案例

北亞資料恢復發表於2022-05-06

伺服器資料恢復環境:

HP ProLiant系列伺服器;

6塊73GB的SAS硬碟組成的RAID5;

作業系統:WINDOWS SERVER;

儲存檔案:企業的內部檔案,無資料庫檔案。



伺服器故障:

由於沒有配備UPS,伺服器遇到幾次意外斷電,但是重啟後沒有出現異常,直到最近一次斷電重啟後RAID報錯,無法找到存

儲裝置,進入到RAID管理模組進行操作導致當機。伺服器管理員多次嘗試重啟伺服器,但是沒法進入系統。


伺服器故障分析:

本案例是典型的伺服器意外斷電導致的RAID模組損壞(包括RAID管理資訊丟失和RAID模組硬體損壞)。一般在RAID陣列創

建完成後,陣列的管理模組資訊就會固定下來不再發生改變,但是陣列的模組資訊是可以修改的。伺服器意外斷電很容易造成

陣列的模組資訊被篡改甚至丟失,多次斷電甚至有可能造成RAID卡上的元器件損壞,使主機失去對多塊物理硬碟進行RAID管

理的中間層模組。該案例中對RAID模組的操作導致當機極有可能是因為RAID卡硬體損壞,使用常規方法無法獲取6塊硬碟中

的資料,只能透過專業的資料恢復操作來恢復原先的資料。


伺服器資料恢復過程:

1、首先對原伺服器內所有硬碟進行物理故障檢測,檢查硬碟是否有硬體故障。檢測後發現伺服器內所有硬碟均可以正常讀取

,沒有發現存在物理故障。

2、對伺服器內的所有硬碟進行映象備份。

3、映象完成後,伺服器資料恢復工程師分析raid結構,確定raid陣列的硬碟順序、資料塊的大小和陣列校驗方式等raid資訊。

4、伺服器資料恢復工程師利用分析獲取到的raid陣列資訊虛擬重建一組RAID並進行邏輯校驗,確認重構的RAID所應用的各項

引數正確無誤後,針對伺服器管理員最為關注的資料進行驗證;

5、資料恢復工程師聯絡伺服器管理員對恢復出來的資料進行驗證,經過驗證後所有資料均成功恢復;

6、把資料遷移到伺服器管理員重新搭建出來的和原伺服器一樣的環境中,經過測試後一切正常。


伺服器資料安全小貼士:

1、保證機房供電穩定,儘量減少供電異常對主機及儲存的影響;

2、為關鍵的伺服器和儲存配置UPS,在機房意外斷電的情況下保證核心業務系統能繼續維持正常工作,為其他應急方案的實

施爭取時間;

3、對於使用時間長的伺服器應定期進行安全檢查,對其整體執行狀態進行評估,是否對其進行硬體及系統的升級;

4、提前制定突發資料災難的應急處理方案,減少資料災難帶來的損失。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2892302/,如需轉載,請註明出處,否則將追究法律責任。

相關文章