【分散式儲存資料恢復】hbase和hive資料庫底層檔案誤刪的資料恢復案例

北亞資料恢復發表於2022-12-16

分散式儲存資料恢復環境:

16臺物理伺服器,每臺物理伺服器上有數臺虛擬機器;

虛擬機器上配置分散式,上層部署hbase資料庫和hive資料庫。


分散式儲存故障&分析:

誤刪除資料庫底層檔案,資料庫不能使用。需要恢復hbase和hive資料庫。

透過現場對使用者環境的檢測,資料恢復工程師發現虛擬機器還可以正常啟動,虛擬機器上的資料庫塊檔案丟失。塊檔案丟失之後

沒有新的資料寫入操作,底層的資料損壞可能性比較小。


分散式儲存資料恢復過程:


1、備份。

對物理伺服器底層做備份。透過網路直接備份虛擬機器底層磁碟檔案。

準備一臺伺服器,以只讀方式掛載所有伺服器硬碟,使用磁碟備份工具進行扇區級別的備份。


2、分析塊檔案結構。

分析每個虛擬機器磁碟的塊檔案&檔案底層的聚合方式&每個磁碟中資料的分佈情況。


3、分析Block檔案key。

定位&提取並解析資料庫檔案中key資訊,整合資料庫檔案key資訊。


4、拼接Block檔案。

根據Block檔案的key資訊提取檔案片段,拼接提取出來的Block檔案片段並校驗拼接出來的Block檔案的正確性。


5、匯入Block檔案。

校驗提取出的Block檔案完整性及正確性並把提取出來的Block檔案匯入到hbase和hive資料庫中。


6、驗證資料。

在北亞資料恢復工程師的協助下,由使用者對恢復出來的資料進行驗證。如果發現問題,重新檢驗上述所有過程。


北亞資料恢復服務:

1、整個過程不會對原盤進行任何寫入操作。

2、儘可能保證操作可逆,確保人力可控範圍內操作可回溯。

3、提供後期資料保管和服務跟蹤。

4、所有操作都是在有備份的情況下進行,若不成功不影響其他方案。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2928336/,如需轉載,請註明出處,否則將追究法律責任。

相關文章