【伺服器資料恢復】NetApp儲存中lun被誤刪除的資料恢復過程

北亞資料恢復發表於2023-04-13

伺服器資料恢復環境:

NetApp某型號儲存,有數十塊SAS硬碟,劃分的lun都對映給小型機使用,存放的是Oracle資料庫檔案,採用ASM裸裝置存

儲方式。


伺服器故障:

管理員誤操作刪除了該NetApp儲存上的所有lun。具體情況是:工作人員給NetApp儲存裝置重新劃分空間,直接把儲存的

卷全部刪除並進行重新分配。在刪除所有卷後還沒有來得及分配的時候,上層業務就出現異常。運維工程師緊急排查故障情

況,發現業務伺服器上的磁碟都不見了,無法訪問資料。


伺服器資料恢復過程:

1、為了預防在資料恢復過程中可能對原始磁碟資料造成的二次破壞,將該NetApp儲存上的每塊磁碟以只讀方式做完整映象

。後續所有的資料分析和資料恢復操作都在映象檔案上進行。

2、基於映象檔案分析Netapp儲存資料。

a、分析盤序和LVM的組成方式;

b、掃描硬碟內的所有節點,一般只掃描“MBFI”。

c、在節點掃描結果中找到檔案大小符合需求的節點並提取此節點uid,並判斷索引根。

d、根據索引根內的第一級資料指標提取本檔案的所有直接資料指標(需要參考節點中0x03位置的MAP深度。為0x00時直

接從節點內提取資料,為0x01時需要提取一次MAP,為0x02時需要提取兩次MAP......)。在指標提取完畢後開始提取檔案

資料。

3、解析超級塊。在硬碟的前面扇區的位置找到超級塊相關資訊,從超級塊中獲取到磁碟組名字、磁碟組的邏輯起始塊號、

總塊數、磁碟組中raid的編號。

netapp超級塊資訊:

4、剔除校驗盤。

每個資料塊佔8個扇區,資料塊後附加64位元組資料塊描述資訊。根據這些資訊可以判斷出作為校驗盤(提取資料時校驗盤需

剔除)的磁碟。

校驗塊描述資訊:

5、判斷aggr盤。

確定各個磁碟所屬aggr組,然後判斷組內盤序(依據每塊磁碟8號扇區的磁碟資訊以及磁碟末尾的RAID盤序表確定盤序)

。資料指標跳轉時不考慮校驗盤,所以只取得資料盤的盤序即可。

netapp盤序表:

6、分析節點及節點頭部資訊。

Netapp的節點分佈在數量眾多的資料塊內,在資料塊內又被統一組織為節點組。每個節點組的前半部分位元組記錄系統資料

,後半部分位元組記錄各個檔案節點。根據使用者級別可將節點分為兩類:“MBFP”系統檔案節點和“MBFI”使用者檔案節點,

在資料恢復時一般只取MBFI節點組即可。

netapp節點樣:

7、獲取目錄項,並根據目錄項節點編號找到對應節點。

目錄項資訊:

8、分析出該Netapp儲存結構後,用北亞企安自研的NetApp解析程式解析asm檔案系統,提取出oracle資料庫檔案。

9、搭建小機環境並安裝oracle資料庫,檢測提取出來的資料庫檔案和備份檔案。

10、使用提取出的資料庫檔案啟動oracle資料庫,啟動正常。

11、使用最新的資料庫備份檔案還原資料庫,然後由使用者方親自進行驗證,經過反覆驗證,使用者方確認恢復出來的oracle數

據庫資料完整可用,資料恢復工作完成。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2945479/,如需轉載,請註明出處,否則將追究法律責任。

相關文章