【伺服器資料恢復】Raid陣列更換故障硬碟後資料同步失敗的資料恢復案例

北亞資料恢復發表於2022-08-02

伺服器資料恢復環境:

IBM某型號小型機+AIX+Sybase+某型號儲存陣列櫃。

陣列櫃12塊SAS機械硬碟組成RAID(其中一塊為熱備盤)。


伺服器故障:

一塊磁碟出現故障離線,管理員更換磁碟,開始同步資料,資料同步到一半左右時,另一個磁碟也出現故障,邏輯盤無法掛

載在小型機上,業務中斷。儲存管理介面顯示兩塊硬碟故障離線。其中10號槽位故障硬碟為熱備盤,3號槽位故障硬碟情況

如下圖所示:




儲存陣列櫃中的2組Mdisk加到一個pool中,主要資料pool無法載入,其中三個通用卷均無法掛載,具體情況如下圖所示:



管理員聯絡我們資料恢復中心進行資料恢復。


伺服器資料恢復過程:

1、伺服器資料恢復工程師使用工具對其中的10塊磁碟做映象, 用PC3000給故障盤做映象,所有的資料恢復操作都在映象

盤上進行, 不會對原始磁碟資料造成影響。


2、經過北亞伺服器資料恢復工程師團隊會診,最後確定了2種資料恢復方案。


資料恢復方案一:對儲存進行強制上線操作。

1、首先分析底層資料,找到故障儲存中的故障硬碟的離線順序。

2、修復後離線的故障硬碟。

3、將修復完成的硬碟插回儲存進行強制上線操作。


資料恢復方案二:解析儲存結構。

1、對Mdisk進行分析和重組。

A、根據使用者提供的部分配置資訊,將硬碟按照Mdisk組分類。

B、分析每一組Mdisk中的所有硬碟獲取相關raid資訊。

C、使用資料恢復軟體對Mdisk進行虛擬重組。  

2、對pool進行分析。

A、分析所有Mdisk獲取到pool的相關資訊。

B、解析pool在Mdisk上的分佈情況。

3、LUN結構分析。

A、分析pool中的條帶大小。

B、解析LUN點陣圖,分析各LUN在pool中的分佈情況。

C、北亞資料恢復工程師編寫程式提取LUN。



驗證資料&資料移交 :

對生成出的資料進行隨機抽樣檢測,沒有大量資料問題。在儲存裝置上建立與原先環境一樣大小數量的LUN,將提取出的數

據LUN的映象檔案複製到儲存上建立的LUN中,交給使用者。資料移交後,使用者重新配置儲存環境,資料一切正常,本次資料

恢復工作圓滿完成。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2908538/,如需轉載,請註明出處,否則將追究法律責任。

相關文章