【北亞資料恢復】分散式儲存hbase和hive資料庫底層檔案被誤刪除的資料恢復案例

北亞資料恢復發表於2022-02-23

分散式儲存環境:


Dell PowerEdge機架式伺服器;

資料庫型別:Hbase、Hive;

16臺物理伺服器。



故障:


16臺伺服器節點,在每臺物理伺服器上平均有3臺虛擬機器,在虛擬機器上配置分散式,上層部署的hbase資料庫和hive資料庫。

資料庫底層檔案被誤刪除,導致資料庫不可用。管理員聯絡北亞資料恢復中心恢復hbase和hive資料庫的資料。



分散式儲存資料恢復過程:


經過現場對環境的簡單檢測,北亞資料恢復工程師發現虛擬機器還可以正常啟動,但是虛擬機器上部署的資料庫塊檔案丟失。塊

檔案丟失之後整個叢集環境沒有新的資料寫入,底層資料損壞可能性比較小,具有較大的可恢復性。由於還沒有對底層結構

進行分析,再加上hbase和hive的演算法和底層結構十分複雜,恢復概率無法準確判斷。


1、備份:

A、將儲存裝置斷電、關機,對物理伺服器底層做備份。

B、從虛擬機器層面備份,通過網路直接備份虛擬機器底層磁碟檔案。

C、北亞資料恢復工程師準備了一臺資料恢復伺服器,在這臺資料恢復伺服器上以只讀方式掛載原伺服器的硬碟,使用北亞

磁碟備份工具進行完整的扇區對扇區的備份。

D、備份完成後,由北亞資料恢復工程師提供詳細報告,然後將原伺服器硬碟交還給管理員。


2、塊檔案結構分析:

A、對每個虛擬機器磁碟的塊檔案進行分析;

B、分析檔案底層的聚合方式;

C、分析每個磁碟中資料的分佈情況。


3、Block檔案key分析:

A、定位資料庫檔案中的key資訊;

B、提取並解析資料庫檔案中key資訊;

C、整合資料庫檔案key資訊。


4、Block檔案拼接:

A、根據Block檔案的key資訊提取檔案片段;

B、對Block檔案的片段進行拼接;

C、校驗拼接後的Block檔案的正確性。


5、Block檔案匯入:

A、校驗提取出的Block檔案完整性及正確性;

B、把提取出來的Block檔案匯入到hbase和hive資料庫中。


6、資料驗證:

A、由管理員對恢復出來的資料進行詳細驗證;

B、如發現新問題,則覆盤資料恢復過程查詢問題原因並加以解決。



北亞資料恢復服務:

1、整個過程不會對原盤有任何的寫操作,以確保原盤的資料安全;

2、盡最大可能保證服務的操作可逆,確保人力可控範圍內操作可回溯;

3、提供後期資料保管和服務跟蹤;

4、以上所有操作在有備份的情況下進行,若不成功不影響其他資料恢復方案的進行。



本次資料恢復週期:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2857381/,如需轉載,請註明出處,否則將追究法律責任。

相關文章