一、瞭解hbase的儲存體系。
hbase的儲存體系核心的有Split機制,Flush機制和Compact機制。
1、split機制
每一個hbase的table表在剛剛開始的時候,只有一個region,隨著資料的不斷插入到表中,region開始增大,當增大到一定的閥值以後,region就會等分兩個新的region。
當table表中的行數越多,就會有越來越多的region。
region是hbase中分散式儲存和負載均衡的最小單元,相當於HDFS中的block。
2、Flush機制
HStore儲存是HBase儲存的核心,其中由兩部分組成,MemStore和StoreFiles。MemStore是Sorted Memory Buffer,
使用者寫入的資料首先會寫入MemStore,就返回了,所以寫效能很高。當MemStore滿了以後會Flush成一個StoreFile。
3、Compact機制
當StoreFile檔案數量增長到一定閾值,會觸發Compact合併操作,將多個StoreFiles合併成一個StoreFile,合併過程中會對Cell進行版本合併和資料刪除。