如果RAID陣列崩潰你能想到哪些好的補救方式，學會這一步顛覆你以往認知。

一、儲存故障概述

1 、故障環境

兩組分別由 4 塊 600 G 容量的 SAS 硬碟組成的 raid5 陣列，並且兩組陣列劃分 LUN ，組成 LVM 結構，並格式化為 EXT3 檔案系統。

2 、故障分析

一塊硬碟意外離線，熱備盤上線，頂替離線硬碟。但在熱備盤上線過程中，又一塊硬碟離線，導致熱備盤同步失敗，兩組 raid 陣列中的一組崩潰， LVM 結構不完整，檔案系統無法正常使用。對兩塊離線硬碟進行檢測，發現先離線硬碟無法識別，初步推斷是硬體故障，需要進行開盤修復操作，另一塊硬碟可以識別。

二、解決方案概述

根據前期的故障分析結果，總結出以下解決方案：

1、對故障硬碟進行修復，使用 MRT 專業資料恢復軟體對故障硬碟進行備份。

2、使用專業資料恢復軟體 winhex 對 raid 其餘成員盤和另一組 raid 全部成員盤進行全盤備份。

3、分析每個硬碟的資料，根據分析的結構重組 RAID 陣列。

4、分析重組完的陣列，找到 LVM 資訊，重組 LVM 卷。

5、對重組的 LVM 捲上的 EXT3 檔案系統進行解析，恢復並匯出全部資料。

三、實施解決方案

1 、故障盤修復

對故障硬碟進行開盤修復操作。開盤後發現，硬碟碟片磨損嚴重，已無法修復，只能對陣列進行缺盤處理。

2 、硬碟備份

使用專業資料恢復軟體 winhex 對故障 raid 陣列的其餘成員盤進行全盤備份，並且對另一組好的 raid 陣列的全部成員盤進行全盤備份，備份情況如下：

3 、重組 raid 陣列

仔細分析硬碟底層資料，通過對 EXT3 檔案系統結構進行解析，分別分析出兩組 raid 陣列的盤序、條帶大小、校驗方向等配置資訊，使用專業資料恢復軟體 winhex 重組出兩組 raid 陣列。經分析，兩組 raid 陣列塊大小都為 64 K ，校驗方向為做同步，對故障 raid 進行重組時注意進行缺盤處理。

4 、重組 LVM 結構

重組出兩組 raid 陣列之後，對兩組 raid 中的底層資料進行分析，找到 LVM 結構資訊，對 LVM 結構進行分析，將兩組 raid 中作為 PV （ LVM 物理卷）的 LUN 匯出，然後使用專業資料恢復軟體 UFS E xplorer 將兩個 PV 重組，重新生成 LVM 邏輯卷。

5 、恢復資料

LVM 重組之後，對 LV （邏輯卷）中的 EXT3 檔案系統進行解析，恢復並匯出其中的全部資料。以下為回覆出來的資料：

四、資料校驗

對恢復出來的資料，挑選部分壓縮檔案等進行校驗，發現部分檔案損壞，對解析結果和恢復結果對比，發現部分檔案損壞且無法恢復。經過分析，初步推斷檔案損壞與兩組 raid 中部分硬碟存在壞道有關。以下為兩組 raid 中部分硬碟壞道情況：

R aid 1 ： 2# 67 bad source sectors encountered.

4# 13 bad source sectors encountered.

R aid 2 ： 2# 37 bad source sectors encountered.

五、恢復結論

由於故障硬碟損壞嚴重，硬體無法修復，並且部分硬碟存在壞道，導致 raid 結構中可能存在缺陷，部分檔案損壞，但大部份檔案經驗證後恢復成功，只有小部分檔案丟失或者損壞，本次資料恢復成功完成。

來自 “ ITPUB部落格 ” ，連結：http://blog.itpub.net/31380569/viewspace-2651288/，如需轉載，請註明出處，否則將追究法律責任。

如果RAID陣列崩潰你能想到哪些好的補救方式，學會這一步顛覆你以往認知。

一、儲存故障概述

1 、故障環境

2 、故障分析

二、解決方案概述

三、實施解決方案

1 、 故障盤修復

2 、 硬碟備份

3 、 重組 raid 陣列

4 、 重組 LVM 結構