伺服器資料恢復-raid結構分析方法

北亞資料恢復發表於2018-08-20

1.伺服器資料恢復故障描述

伺服器型號:HP P2000
伺服器作業系統:VMWARE ESX
伺服器檔案系統:VMFS
磁碟陣列級別:RAID-5
需要進行資料恢復的伺服器掛載了8塊硬碟組成RAID-5磁碟陣列,其中4號盤是熱備盤,伺服器在正常執行中兩塊硬碟亮黃色故障燈,經使用者方維護人員檢測,故障硬碟應為物理故障,表現為:序列號無法讀取,在SAS擴充套件卡上硬碟無法識別。需要對raid磁碟陣列進行資料恢復

2.硬碟物理故障修復

由於伺服器故障情況嚴重,需要首先確定該組raid陣列的磁碟掉線原因,工程師在接到使用者伺服器後優先處理raid陣列中的兩塊掉線盤,將壞盤連線到外部的SAS擴充套件卡上加電檢測,磁頭不尋道,工程師將PCB分離、檢查硬碟HDA元件發現有部分氧化,進行清潔操作後再次加電檢查依然無法尋道。於是工程師進行十分複雜的修盤工作(無塵室禁止拍照.修盤過程無圖)
由於熱備盤是正常硬碟,可以作為備件盤使用。於是硬體工程師將備件盤(也就是raid陣列中的4號盤)開盤拆取PCB安裝到故障盤上替換故障盤的PCB進行修復,再將故障盤PCB上的ROM晶片拆取替換到新PCB上。硬碟硬體修復完成後再次對故障硬碟進行檢測可以正常起轉,磁頭尋道聲音正常,但是敲盤聲音明顯。由於4號盤的磁頭與故障盤並不匹配,在另找配件後進行更換磁頭操作,硬碟可以正常識別,故障盤資料映象成功。

3.重組RAID-5磁碟陣列

使用資料恢復工具開啟7塊磁碟發現所有硬碟的的0扇區都有“55 AA”標誌,0x01C2H處表示該分割槽的型別,這裡顯示“05”,代表這是一個擴充套件分割槽。因此從0扇區看這是一個不正常的MBR分割槽結構。
按照這一方法繼續查詢,分別在7號盤和8號盤找到了“55 AA”的標誌。8號盤查詢結果如下。這是一個正常的MBR分割槽,其0x01C6處數值代表指向的下一個扇區為GPT的頭部。

7號盤查詢結果如下。其0x01C6處數值代表指向下一個扇區。但是下一個扇區很明顯不是GPT的頭部。

由此可以確定8號盤是第一塊盤,7號盤可能是最後一塊盤。GPT分割槽所在扇區起始於172032扇區,因此初步確定LUN的起始扇區是172032扇區。
知識補課:條帶也就是raid陣列塊,它是RAID處理資料的基本單元。不同的RAID陣列的條帶大小也各不相同。RAID-5的1個條帶組中有1個校驗區,根據這個規律可以對該raid-5陣列進行分析,也可以透過比較法確定條帶大小。如某一條帶組中的校驗區跟這一條帶組中的非校驗區可能相差的很明顯,透過WinHex檢視並做對比,就可以找到條帶大小。工程師對該伺服器raid陣列分析得出條帶大小為1024個扇區。
按照1024扇區分割,使一個記錄為一個條帶的大小,如圖5所示。並且7塊盤跳到同一記錄283123。

當7塊盤都定位到同一位置時,透過對比可以判斷校驗區的走向,繼而判斷整個RAID-5的走向。之前已經判斷出8號盤是第一塊盤了,把8號盤放在第一個位置,確定RAID-5為左走向,盤序為8,2,3,4,1,7,5。

工程師初步確定了LUN的起始扇區是172032扇區。使用資料恢復工具跳到172032扇區對硬碟的使用情況進行觀察,正常情況下這個扇區所屬條帶中的5號盤應該是校驗區,但實際情況中卻顯示校驗區為8號盤,根據該raid左走向的規律,5號盤的校驗區應該在172032-1024=171008扇區,即上一個條帶。跳轉到171008扇區,發現校驗區為5號盤。因此可以確定LUN的起始扇區為171008扇區。
使用資料恢復工具按照確定的盤序重組raid新增進去,如圖所示。選擇RAID-5,Stripe size 512KB,左非同步。

點選Build進行重組。組好後,由於資料從1024*8=8192個扇區開始,若專業恢復工具沒有跳轉到此扇區的功能,那麼剛組好的RAID必須和一個檔案再進行一次Build重組操作。RAID的起始扇區(Start sectors)選擇8192,這個檔案可以任意選擇起始扇區和大小大小(Count sectors),下圖為重組後的raid5磁碟陣列。

4.伺服器資料恢復結果

RAID-5磁碟陣列重建完成經由客戶驗證,驗證透過,伺服器資料恢復成功。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2212381/,如需轉載,請註明出處,否則將追究法律責任。

相關文章