Netapp 資料恢復案例;誤刪除所有lun解決方案

北亞資料恢復發表於2020-01-03

NetApp FAS3220是NetApp推出的中端儲存陣列,針對NAS和SAN環境構建,被定製為虛擬化、私有云或傳統、早先的用途,適用於從幾TB到超過2PB的儲存需求,提供資料保護,可擴充套件性,自動精簡配置,精簡克隆,備份和災難恢復,下面就講解NetApp FAS 3220儲存的資料恢復的方法。

本次講解的NetApp FAS 3220型號的儲存,硬體環境是一共96塊600G的SAS硬碟,硬碟和普通的硬碟還不一樣,這個硬碟的扇區大小是520位元組一個扇區,上層應用環境也很複雜,所有的lun都是對映給小型機使用,存放是Oracle資料庫檔案還是ASM裸裝置儲存方式。可能是工作人員失誤,誤操作刪除了儲存上的是所有lun,據瞭解當時是要重新規劃儲存空間,直接把儲存卷全部刪除進行重新分配。在刪除之後還沒有分配的時候,上層業務就當機了,這個時候運維工程師緊急排查故障情況,發現業務伺服器上的磁碟都沒有了,沒有辦法訪問資料了,發現操作失誤,緊急啟動資料恢復預案。

為保護好現場環境,防止資料恢復過程中由於誤操作對原始磁碟造成二次破壞,資料恢復工程師把每塊磁碟都做只讀完全映象。此後所有恢復操作都在映象檔案上進行。

在做完映象的同時,工程師緊急制定了恢復方案,為客戶講解恢復方案的可行性,客戶認可方案,做完映象之後,我們就立即按照制定方案實施,下面是恢復方案的具體實施步驟:

1、Netapp儲存的儲存過程分析,

第一步,分析盤序和LVM的組成方式。

第二步,掃描硬碟內的所有節點。

第三步,在節點掃描結果中找到檔案大小符合需求的節點並提取此節點。

第四步,根據索引根內的第一級資料指標提取本檔案的所有直接資料指標,在指標提取完畢後開始提取檔案資料。

2、解析超級塊

在硬碟的前面扇區的位置找到超級塊相關資訊,從超級塊中得到相應資訊。

3、剔除校驗盤

資料塊會有資料塊描述資訊。根據這些資訊可以判斷出哪些磁碟是校驗盤(提取資料時校驗盤需剔除)

4、判斷aggr盤序

盤序分析時主要依據每塊磁碟的磁碟資訊以及磁碟的RAID盤序表確定盤序。首先要確定各個磁碟所屬aggr組,然後再判斷組內盤序,取得資料盤的盤序即可。

5、節點及節點頭部資訊分析

Netapp的節點分佈在數量眾多的資料塊內,在資料塊內又被統一組織為節點組。每個節點組的部分位元組記錄一些系統資料,部位元組為一項記錄各個檔案節點。根據使用者級別可分為兩類:系統檔案節點和使用者檔案節點。

6、獲取目錄項,並根據其節點編號,找到對應節點。

7、分析好儲存結構之後,就開始用NetApp解析程式進行資料的提取了, 解析asm檔案系統,提取出資料庫檔案

8、搭建小機環境,安裝oracle資料庫,檢測資料庫檔案和備份檔案。

9、檢測資料庫檔案

使用提取出的資料庫檔案啟動資料庫,正常啟動

10、檢測資料庫備份檔案

篩選出最新的資料庫備份檔案,使用篩選出的備份檔案還原資料庫,經過一一嘗試,篩選出最新的可用的資料庫備份,還原資料庫環境,由客戶進行驗證,客戶對資料庫恢復確認無誤,此次資料恢復工作圓滿成功。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2671807/,如需轉載,請註明出處,否則將追究法律責任。

相關文章