如果RAID陣列崩潰你能想到哪些好的補救方式,學會這一步顛覆你以往認知。

北亞資料恢復發表於2019-07-22

一、儲存故障概述

1 、故障環境

兩組分別由 4 600 G 容量的 SAS 硬碟組成的 raid5 陣列,並且兩組陣列劃分 LUN ,組成 LVM 結構,並格式化為 EXT3 檔案系統

2 、故障分析

一塊硬碟意外離線,熱備盤上線,頂替離線硬碟。但在熱備盤上線過程中,又一塊硬碟離線,導致熱備盤同步失敗,兩組 raid 陣列中的一組崩潰, LVM 結構不完整,檔案系統無法正常使用。對兩塊離線硬碟進行檢測,發現先離線硬碟無法識別,初步推斷是硬體故障,需要進行開盤修復操作,另一塊硬碟可以識別。

二、解決方案概述

根據前期的故障分析結果,總結出以下解決方案:

1、  對故障硬碟進行修復,使用 MRT 專業資料恢復軟體對故障硬碟進行備份。

2、  使用專業資料恢復軟體 winhex raid 其餘成員盤和另一組 raid 全部成   員盤進行全盤備份

3、  分析每個硬碟的資料,根據分析的結構重組 RAID   陣列。

4、  分析重組完的陣列, 找到 LVM 資訊,重組 LVM

5、  對重組的 LVM 捲上的 EXT3 檔案系統進行解析,恢復並匯出全部資料。

 

三、實施解決方案

1 故障盤修復

對故障硬碟進行開盤修復操作。開盤後發現,硬碟碟片磨損嚴重,已無法修復,只能對陣列進行缺盤處理。

2 硬碟備份

使用專業資料恢復軟體 winhex 對故障 raid 陣列的其餘成員盤進行全盤備份,並且對另一組好的 raid 陣列的全部成員盤進行全盤備份,備份情況如下:


3 重組 raid 陣列

仔細分析硬碟底層資料,透過對 EXT3 檔案系統結構進行解析,分別分析出兩組 raid 陣列的盤序、條帶大小、校驗方向等配置資訊,使用專業資料恢復軟體 winhex 重組出兩組 raid 陣列 經分析,兩組 raid 陣列塊大小都為 64 K ,校驗方向為做同步,對故障 raid 進行重組時注意進行缺盤處理。

4 重組 LVM 結構

重組出兩組 raid 陣列之後,對兩組 raid 中的底層資料進行分析,找到 LVM 結構資訊,對 LVM 結構進行分析,將兩組 raid 中作為 PV LVM 物理卷)的 LUN 匯出,然後使用專業資料恢復軟體 UFS E xplorer 將兩個 PV 重組,重新生成 LVM 邏輯卷。

5 、恢復資料

LVM 重組之後,對 LV (邏輯卷)中的 EXT3 檔案系統進行解析,恢復並匯出其中的全部資料。以下為回覆出來的資料:

資料校驗

對恢復出來的資料,挑選部分壓縮檔案等進行校驗,發現部分檔案損壞,對解析結果和恢復結果對比,發現部分檔案損壞且無法恢復。經過分析,初步推斷檔案損壞與兩組 raid 中部分硬碟存在壞道有關。以下為兩組 raid 中部分硬碟壞道情況:

R aid   1 2#    67 bad source sectors encountered.

4#    13 bad source sectors encountered.

R aid   2 2#    37 bad source sectors encountered.

、恢復結論

由於故障硬碟損壞嚴重,硬體無法修復,並且部分硬碟存在壞道,導致 raid 結構中可能存在缺陷,部分檔案損壞,但大部份檔案經驗證後恢復成功,只有小部分檔案丟失或者損壞,本次資料恢復成功完成。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2651288/,如需轉載,請註明出處,否則將追究法律責任。

相關文章