分散式資料恢復-hbase+hive分散式儲存資料恢復方案

北亞資料恢復發表於2023-11-24

hbase+hive分散式儲存資料恢復環境:

16臺某品牌R730XD伺服器節點,每臺物理伺服器節點上有數臺虛擬機器,虛擬機器上配置的分散式,上層部署hbase資料庫+hive資料倉儲。


hbase+hive分散式儲存故障&初檢:

資料庫檔案被誤刪除,資料庫無法使用。

透過現場對該分散式環境的初步檢測,發現虛擬機器還可以正常啟動,虛擬機器裡面的資料庫塊檔案丟失。好在塊檔案丟失之後沒有對叢集環境寫入資料,底層資料損壞可能性比較小。


hbase+hive分散式儲存資料恢復方案:

1、備份。

A、從物理伺服器底層做備份,將裝置斷電、關機。將所有磁碟編號後從伺服器/儲存中取出。

B、從虛擬機器層面備份,透過網路直接備份虛擬機器底層磁碟檔案。

C、北亞企安資料恢復中心準備一臺伺服器以只讀方式掛載伺服器硬碟,對所有磁碟進行扇區對扇區的全盤映象備份。

D、備份完成後提供詳細報告,內容涉及所有磁碟的健康狀態和存在的壞道列表。

E、將伺服器硬碟按照編號還原到原伺服器/儲存裝置中,之後資料分析和資料恢復操作都基於映象檔案進行,避免對原始磁碟資料造成二次破壞。


2、基於映象檔案分析塊檔案結構。

A、分析每個虛擬機器磁碟的塊檔案。

B、分析檔案底層的聚合方式。

C、分析磁碟中資料分佈情況。


3、分析Block檔案key。

A、定位資料庫檔案中的key資訊。

B、提取並解析資料庫檔案中key資訊。

C、整合資料庫檔案key資訊。


4、拼接Block檔案。

A、根據Block檔案的key資訊提取檔案片段。

B、拼接Block檔案的片段。

C、校驗拼接後的Block檔案的正確性。


5、匯入Block檔案。

A、校驗提取出來的Block檔案完整性和正確性。

B、把提取出來的Block檔案匯入到hbase和hive資料倉儲中。


6、驗證資料。

由使用者對資料進行詳細驗證。如果發現問題則重新檢驗上面的恢復流程。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31380569/viewspace-2997145/,如需轉載,請註明出處,否則將追究法律責任。

相關文章