分散式儲存系統,HBase的基本原理與基本架構

shenmanli發表於2017-09-18
HBase是一個構建在HDFS上的分散式列儲存系統。HBase是Apache Hadoop生態系統中的重要一員,主要用於海量結構化資料儲存;


從邏輯上講,HBase將資料按照表、行和列進行儲存。兩者都具有良好的容錯性和擴充套件性,都可以擴充套件到成百上千個節點;



Hbase表的特點


大:一個表可以有數十億行,上百萬列;
無模式:每行都有一個可排序的主鍵和任意多的列,列可以根據需要動態的增加,同一張表中不同的行可以有截然不同的列;
面向列:面向列(族)的儲存和許可權控制,列(族)獨立檢索;
稀疏:對於空(null)的列,並不佔用儲存空間,表可以設計的非常稀疏;
資料多版本:每個單元中的資料可以有多個版本,預設情況下版本號自動分配,是單元格插入時的時間戳;
資料型別單一:Hbase中的資料都是字串,沒有型別。


Hbase資料模型


HBase是基於Google BigTable模型開發的,典型的key/value系統;



Hbase邏輯檢視



HBase schema可以有多個 Table,每個表可由多個Column Family組成。HBase可以有 Dynamic Column列名稱是編碼在cell中的,不同的cell可以擁有不同的列。


相關文章