伺服器raid5陣列故障排查及資料恢復方法篇

北亞資料恢復發表於2020-02-21

【伺服器故障情況概述】

今天介紹的是伺服器raid5陣列因為不明原因導致陣列崩潰後的故障排查方法,以及伺服器資料恢復過程。下面簡單介紹一下需要恢復資料的伺服器硬體配置情況:

本次資料恢復案例中的伺服器型號為某品牌X3850型號,伺服器上組建了一個raid5磁碟陣列,陣列裡包含4塊成員盤和1塊熱備盤一共5塊。

伺服器再正常使用過成功突然崩潰,管理員檢視raid陣列狀態時發現陣列中有2塊硬碟掉線,熱備盤沒有啟用。需要從伺服器層面進行資料恢復操作。


【伺服器資料恢復普通流程】

首先關閉伺服器並保證在排查故障和資料恢復的過程中原始伺服器狀態不被破壞或變更。

將陣列內所有硬碟明確編碼後移除伺服器,將硬碟掛載到伺服器資料恢復專用儲存裝置上,對raid5陣列中的所有硬碟做完全映象後恢復故障伺服器狀態。

對映象出的伺服器資料進行raid結構分析,透過分析提取到磁碟陣列的raid條帶資訊、條帶分佈規律、raid陣列校驗方向以及meta區域等基礎資訊。

得到上述陣列資訊後,伺服器資料恢復工程師在資料恢復專用伺服器上虛擬重組了一個相同的raid5陣列環境,進一步解析虛擬磁碟的檔案系統資料。

對分析出來的資料進行驗證提取,確認資料正確後使用linux livecd或win pe(通常不支援)等進行資料回遷。


【伺服器raid5資料恢復過程】

資料恢復工程師對所有硬碟進行映象後分析raid5結構,經過分析得到最佳結構為0,1,2,3盤序,缺3號盤,塊大小512扇區,backward parity(Adaptec),

按照伺服器資料恢復普通方法,資料恢復工程師對上述資料進行驗證,所有壓縮包均可正常解壓,結構正確。

按照資料恢復工程師分析到的raid5陣列結構虛擬重組raid陣列,重組後的raid5陣列經過驗證未發現任何報錯。

對raid5陣列的檔案系統進行解析和資料提取,提取資料正常。

經客戶伺服器管理員對提取出來的資料驗證後配合客戶管理員將恢復出來的所有資料回遷到客戶準備的伺服器內。回寫後啟動作業系統進行最終資料驗證。


【伺服器資料恢復結果】

經過客戶伺服器管理員驗證,伺服器raid5陣列內的所有資料恢復完整,資料應用正常,本次資料恢復圓滿完成。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2676625/,如需轉載,請註明出處,否則將追究法律責任。

相關文章