伺服器恢復資料

港澳小肖2501438221發表於2022-05-13

伺服器資料恢復環境:

10個磁碟櫃,每個磁碟櫃24塊硬碟;

9個儲存櫃儲存資料,1個儲存櫃儲存後設資料;

後設資料儲存櫃中的24塊硬碟配置情況:9組RAID1陣列+1組4盤位RAID10陣列+4個全域性熱備硬碟。

資料儲存櫃中硬碟配置:共36組6盤位的RAID5,分為2個儲存系統。



伺服器故障:

資料儲存櫃的1個儲存系統中的一組RAID5由於2塊硬碟先後故障離線,RAID陣列失效,整個儲存系統崩潰,無法使用。

儲存及檔案系統架構大致如下:

注:Meta_LUN(後設資料卷)    Data_LUN(使用者資料卷)



伺服器資料恢復過程:


1、為了防止伺服器資料恢復操作對原始磁碟資料造成二次破壞, 首先對儲存中所有硬碟進行備份。

備份過程如下:


對故障RAID中的6塊盤進行編號標記,將硬碟從儲存櫃中拔出接入到備份伺服器上進行備份。

對沒有出現故障的RAID陣列進行儲存層面的備份。使用光纖線纜將備份平臺和儲存裝置連線,進入儲存裝置管理介面配置

備份平臺和儲存裝置讓2者可以正常通訊,使用軟體對RAID中的LUN進行映象備份。

在備份過程中發現故障RAID中的1塊硬碟存在大量的壞道,在備份的過程出現錯誤,無法繼續備份。對故障硬碟開盤更換

韌體,使用工具對其進行修復後繼續備份,但壞道仍然存在。

部分映象檔案:



2、RAID資料分析。

對故障RAID進行分析獲取相關RAID資訊,使用軟體對RAID陣列進行虛擬重組,並將RAID中的LUN恢復成映象檔案。在

分析過程中發現,損壞較嚴重的硬碟為後離線硬碟,由於此硬碟存在大量壞道,可能對最後的恢復結果產生一定的影響。


3、登入儲存裝置管理介面,獲取到StorNext檔案系統中卷的相關資訊。



4、繼續對StorNext檔案系統中的Meta卷和Data捲進行分析。本案例的StorNext檔案系統包含2個Data卷,每一個完整的

Data卷都是由多組RAID中的LUN組成的。對這些LUN進行分析獲取到LUN之間組合的演算法規律,虛擬重組出完整的Data卷。



5、分析Meta卷。對Meta卷中的節點資訊、目錄項資訊以及Meta卷和Data之間的對應關係進行分析,針對一個Meta卷

管理多個Data卷的情況研究獲取到Meta捲到Data卷的索引演算法。


檔案節點如下:


目錄塊如下:


6、掃描解析資料。

通過前面的分析研究已經獲取到了資料恢復工作所需的全部資訊。北亞資料恢復工程師編寫程式掃描Meta卷中的節點資訊

和目錄項資訊,同時對目錄項和節點進行解析,獲取完整的檔案系統目錄結構,解析每一個節點中的指標資訊,將這些信

息記錄在資料庫中。


7、提取資料。

編寫檔案提取程式讀取資料庫,根據解析出的資訊以及兩個Data卷之間的聚合演算法對資料進行提取。


8、資料檢測驗證。

對恢復出來的資料進行隨機抽樣檢測沒有發現問題。將使用者所需全部檔案提取到本地進行資料移交。使用者對恢復出來的數

據進行驗證後確認恢復出來的資料完整無誤。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70014415/viewspace-2893938/,如需轉載,請註明出處,否則將追究法律責任。

相關文章