【伺服器資料恢復】Raid5熱備盤同步失敗導致檔案系統不可用的資料恢復案例

北亞資料恢復發表於2024-01-08

伺服器資料恢復環境:

兩組由4塊磁碟組建的raid5磁碟陣列,兩組raid5陣列劃分為lun並組成了lvm結構,ext3檔案系統。


伺服器故障:

一組raid5陣列中的一塊硬碟離線,熱備盤自動上線並開始同步資料。在熱備盤完成同步之前,該組raid5陣列中另一塊硬碟離線,熱備盤同步失敗,該組raid5陣列崩潰無法使用,lvm結構被破壞,ext3檔案系統無法正常使用了。

將故障伺服器中出現問題的那組raid5陣列中的硬碟編號後取出。由硬體工程師對所有硬碟進行硬體故障檢測,經過檢測發現第一塊離線硬碟存在物理故障,需要進行開盤修復後才能正常讀取資料,後掉線的硬碟可以正常識別。


伺服器資料恢復過程:

1、硬體工程師在無塵環境下將存在物理故障的那塊磁碟進行了開盤,開盤後發現碟片上有大量嚴重劃痕,無法修復&讀取上面的資料,只能採取缺盤處理。

2、將故障raid5陣列的其他完好硬碟以只讀方式進行扇區級的映象,為了安全起見,將另一組正常raid5陣列所有磁碟也做了映象。映象完成後按照編號將所有磁碟還原到原伺服器中。後續的資料分析和資料恢復操作都基於映象檔案進行,避免對原始磁碟資料造成二次破壞。

3、基於映象檔案分析所有磁碟底層資料,獲取故障raid5的相關資訊(盤序、條帶、校驗方向等),利用獲取到的raid5資訊虛擬重組raid5陣列,對於無法修復的故障硬碟則進行缺盤處理。

4、分析重組出來的raid5陣列,找到lvm結構資訊。

5、分析lvm結構,北亞企安資料恢復工程師編寫程式提取raid5陣列中的lvm物理卷lun。

6、重組pv&生成lvm卷。

5、分析重組好的lvm卷內的EXT3檔案系統,使用北亞企安自主研發的工具解析&匯出ext3檔案系統資料。


伺服器資料驗證:

在這個伺服器資料恢復案例中,有一塊硬碟存在嚴重的物理故障,無法修復,在資料恢復過程中會出現raid結構缺陷或者檔案損壞的情況,好在本案例中絕大部分檔案透過驗證,只有極少資料損壞嚴重無法恢復。經過驗證,使用者方認可本次資料恢復結果。


來自 “ ITPUB部落格 ” ,連結:https://blog.itpub.net/31380569/viewspace-3003036/,如需轉載,請註明出處,否則將追究法律責任。

相關文章