【伺服器資料恢復】斷電導致ProLiant伺服器RAID模組損壞的資料恢復案例

北亞資料恢復發表於2022-10-10

伺服器資料恢復環境:

ProLiant某型號伺服器;

6塊SAS硬碟組成RAID5;

WINDOWS SERVER作業系統;

儲存企業部門內部檔案。



伺服器故障&分析:

出現幾次意外斷電後,故障伺服器再次重啟後RAID報錯,提示無法找到儲存裝置,進入RAID管理模組介面後當機,管理員

重啟故障伺服器後問題依舊。使用者聯絡到我們資料恢復中心尋求幫助。

本案例的伺服器故障屬於伺服器意外斷電導致RAID模組損壞(RAID模組損壞故障包括RAID管理資訊丟失和RAID模組硬體

損壞),這類伺服器故障情況我們資料恢復中心碰到過很多。正常情況下,RAID建立完成後管理模組的資訊就不會輕易改變

。但管理模組的資訊畢竟是可修改的,意外斷電這種突發情況就很容易導致管理模組的資訊被篡改甚至丟失,多次斷電甚至

會對RAID模組硬體造成物理傷害,讓伺服器失去對硬碟進行RAID管理的中間層模組。本案例中對RAID模組的操作導致當機

的故障就很可能是RAID模組硬體損壞造成的,這種情況下無法透過常規方法讀取到故障伺服器中6塊硬碟的資料,只能透過

專門的資料恢復技術來恢復其中的資料。


伺服器資料恢復過程:

1、硬體工程師對故障伺服器中的6塊SAS硬碟進行物理故障檢測,所有硬碟均可正常讀取,沒有發現物理故障。

2、對故障伺服器中的6塊硬碟做映象備份,後續的資料恢復操作都在映象檔案上進行,避免對原始資料造成二次損壞。

3、基於映象備份檔案分析故障RAID5的結構,北亞伺服器資料恢復工程師結合故障伺服器檔案系統儲存規則獲取到故障

RAID5的盤序、資料塊大小及校驗方式,透過這些raid相關資訊虛擬重組原始RAID5。

4、邏輯校驗新構建RAID5中的資料,確認新構建RAID5所有引數準確無誤後,北亞資料恢復工程師對最重要的資料進行完全

驗證。

5、讓使用者對恢復出來的資料進行驗證,確認資料完整可用。

6、將所有資料遷移至使用者準備好的儲存。


伺服器資料安全Tips:

1、保證機房供電穩定,以減少斷電,電壓不穩等電源問題對伺服器和儲存的傷害。

2、為關鍵伺服器及儲存配備UPS,這樣在機房意外斷電的情況下至少能保證核心業務能繼續正常工作,為找到應急解決方案

贏得寶貴的時間。

3、對伺服器和儲存裝置定期進行檢查,對執行狀態進行評估以決定是否需要升級硬體或者系統。提前制定好突發資料災難的

應急處理方案,以降低資料災難帶來的損失。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2917535/,如需轉載,請註明出處,否則將追究法律責任。

相關文章