【伺服器資料恢復】伺服器Raid5陣列mdisk磁碟離線的資料恢復案例

北亞資料恢復發表於2022-08-01

伺服器Raid磁碟離線故障:

伺服器中有一組或多組Mdisk,其中一組Mdisk中有一塊硬碟故障離線,熱備盤啟動並且開始同步資料,如果同組Mdisk中的

另一塊硬碟也因為故障離線就會導致熱備盤同步失敗,該組Mdisk失效,從而導致整個卷無法使用。


伺服器Raid資料恢復過程:

1、對故障陣列中的每一塊磁碟進行映象備份,後期所有的資料恢復工作將在映象檔案上進行,不影響原始磁碟資料。

2、分析並重組Mdisk,首先根據使用者提供的配置資訊,把硬碟按照Mdisk組進行分類。分析每一組Mdisk中的所有硬碟,獲

取raid相關資訊。使用專業的資料恢復軟體虛擬重組Mdisk。

3、分析所有Mdisk獲取到pool的相關資訊。使用專業的資料恢復軟體虛擬重組出pool。

4、掉盤分析。由於raid5最多隻能允許一塊成員盤離線,raid5崩潰至少有兩塊盤發生故障離線。北亞資料恢復工程師對各成

員盤中的底層資料進行分析,發現有兩塊硬碟前部的資料完全一樣,初步判斷這兩塊盤中一塊硬碟為熱備盤,另一塊硬碟為

故障盤。

據此可以判斷故障情況:raid5中有一塊成員盤發生故障離線,熱備盤上線開始同步資料,與此同時另一塊成員盤也發生故障

離線,raid失效。Raid恢復正常時,由於先發生故障的硬碟上的資料已經不是最新的,所以恢復正常後的raid中的資料出現部

分錯誤。

5、對硬碟的raid結構與成員盤的掉盤情況分析完成後,使用專業資料恢復軟體完成對Mdisk和pool的組建,並生成其中的數

據。


小貼士:伺服器磁碟陣列故障後應該怎麼做?

1、不要盲目強行上線。

Offline指示燈亮起,這表示要求更換一個相同型號的無故障硬碟,並且重新校驗演算法。RAID磁碟陣列中很可能有不止一個出

現了不穩定現象,伺服器的Offline提示經常會誤報或是遺漏其他也存在隱患的硬碟。強制上線過程中硬碟進行大量的讀寫操

作,一旦其它硬碟掉線則資料恢復難度加大。所以在強制上線前要檢測每一個硬碟的穩定性,這樣才更加保險。


2、保護好第一現場

對於廠商而言,硬體裝置修復才是售後服務的主要目標,因此往往為修復硬體裝置故障而犧牲掉資料。北亞資料恢復中心的

工程師介紹:使用者尋求廠商的售後服務工程師服務而導致資料被徹底破壞的情況幾乎每個星期都會發生。廠商的售後服務工

程師都偏向於硬體修復,而RAID資料恢復則是以軟體類操作為主。此外,即便是簡單的檢驗性操作,也有可能為後期的資料

恢復帶來不便。當raid硬碟損壞數量超過陣列自身的容錯能力時,必須將損壞硬碟的映象完全提取才能完成最終的恢復。如

果頻繁對硬碟上電,很容易造成磁頭疲勞損傷,甚至劃傷碟片。正確的處理方法應當是立即諮詢專業的資料恢復服務商。


3、選擇專業正規的資料恢復中心

在選擇資料恢復服務商時,公司規模、技術經驗、工程師團隊、業界內的口碑都是需要考量的重要指標。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2908387/,如需轉載,請註明出處,否則將追究法律責任。

相關文章