HBase

lwx_R發表於2024-08-06

hdfs為資料儲存,一種分散式,可擴充的NoSQL資料庫

1.概念

1.1 資料模型

基於BigTable,一個稀疏的,分散式的,持久的多維排序map。
該map由行鍵,列鍵和時間戳索引,map中每一值都是一個未解釋的位元組陣列。
HBase使用和BigTable相似的資料模型,使用者將資料行儲存在帶標籤的表中,資料行具有可排序的鍵和任意數量列。該表儲存稀疏,因此同一表的行可以具有不同的列

1.2 邏輯結構


儲存資料稀疏,資料儲存多維,不同行有不同列。資料儲存整體有序,按照RowKey字典序排列,Rowkey為Byte陣列
按行拆分,塊為Region用於實現分散式結構
按列拆分,為store儲存不同資料夾中

1.3 物理結構

資料對映關係,空白單元格實際底層並不儲存

  • Timestamp: 由於hdfs不能修改資料 不同版本的資料根據該欄位進行區分,讀取資料預設最新版本
  • Type: 刪除為DeleteColumn

相關文章