【伺服器資料恢復】raid5陣列癱瘓導致儲存不可用的資料恢復案例

北亞資料恢復發表於2022-12-26

伺服器資料恢復環境:

EMC某型號儲存;

8塊硬碟組成raid5磁碟陣列。


伺服器故障:

raid5磁碟陣列中2塊硬碟離線,伺服器崩潰,上層應用不可用。


伺服器資料恢復過程:

1、資料恢復工程師將故障儲存裝置內的所有硬碟映象備份,在映象備份過程中沒有發現離線硬碟有物理故障,直接映象故障

儲存中所有硬碟。備份完成後把硬碟按照原樣裝回故障儲存裝置中,後續的資料恢復操作都在映象檔案進行,避免對原始資料

造成二次破壞。

2、資料恢復工程師開始基於映象檔案對底層資料進行分析,計算出故障儲存裝置中原raid5的硬碟盤序、raid條帶大小等raid

資訊,透過這些資訊虛擬重組raid。

3、由於故障儲存中的LUN是基於RAID組的,把raid虛擬重組出來後,北亞資料恢復工程師開始分析LUN在RAID組中的分配

資訊以及LUN分配的資料塊MAP。

4、根據獲取到的關於LUN的資訊,資料恢復工程師使用北亞自研的raid恢復程式解釋LUN的資料MAP,匯出LUN的所有資料

5、使用北亞自研的檔案系統解釋程式對匯出的lun進行檔案系統解釋,在檔案系統解釋過程中出現報錯,資料恢復工程師分

析報錯內容並除錯檔案系統解釋程式,經過分析與除錯確認是由於故障儲存中某些元檔案損壞導致解釋zfs檔案系統程式報錯。

6、資料恢復工程師手動修復損壞的檔案,直至zfs檔案系統可以被正常解析。

7、多次修復和解析zfs檔案系統後對最新資料進行驗證,驗證無誤後聯絡使用者親自對恢復出來的資料進行驗證,確認資料完

整可用。


Tips:

1、伺服器發生故障後,切忌對伺服器進行操作;也不要隨意取出硬碟,以免弄亂盤序。

2、如果需要取出硬碟,標記好硬碟的順序之後再取出。

3、伺服器陣列癱瘓後應該立即斷電,不要做同步或強制上線操作,防止資料進一步破壞。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2929456/,如需轉載,請註明出處,否則將追究法律責任。

相關文章