Hbase-原理-region合併和hfile的合併(大合併、小合併)
Hbase-原理-region合併
為什麼要合併region呢?
因為在刪除region中的資訊的過程中會急劇減少region的行數,導致一個region server中的region太小,所以將多個region合併成少量的region
region手動合併(shell)
表tb_stu的原region資訊
list_regions 'tb_stu'
合併兩個region
merge_region 'a8c282eafa0589e96213b79b6132410d','aaa7d4f6003b2f6fc5ca88e78daf2ff5'
- 在HDFS中檢視
- 原region會在一段時間後自動消失
上面的region合併是大合併
有大量的更新資料和有大量的i小資料的情況下會出發大合併,大合併會佔用很大的資源
hfile合併
在更新資料的過程中,會在HDFS中生成新的hfile檔案用來記錄使用者的操作
當使用者在刪除資料的時候會出現新的hfile檔案,並有墓碑標記
如果使用者查詢資料的時候,會從兩個hfile檔案中結合取資料
所以說Hbase的增刪改查跟HDFS的不能隨意修改不相違背的
經過一段時間後會將兩個hfile檔案進行合併,生成新的hfile檔案(hfile合併俗稱小合併)
相關文章
- Git概念及工作原理總結
- 《深入理解計算機系統原理》學習筆記與習題答案(一)
- 計算機組成與系統結構 cache 原理與計算
- HBase高階特性、rowkey設計以及熱點問題處理
- Laravel 執行原理分析與原始碼分析,底層看這篇足矣
- Spring 事件監聽機制及原理分析
- 用大白話講大資料HBase,老劉真的很用心(1)
- Docker的架構原理和安裝以及基本管理(映象與容器的建立,刪除,匯入及匯出 )
- 格式塔(Gestalt)原理
- 分散式系統原理---CBCAST演算法
- 編譯原理: Thompson 構造法(正規表示式 轉 NFA)
- 計算機組成原理 - 計算篇
- 十分鐘快速掌握HashMap底層實現原理(圖文詳解)
- 計算機網路期末複習 第四講 網路應用工作原理
- 計算機組成原理 第四章【指令系統】課後作業解析【MOOC答案】
- 【學習筆記之作業系統原理篇】儲存管理
- Altium Designer繪製電路原理圖——PCB圖