NoSQL 複習 (二)HBase基本原理

czj_ppt發表於2020-12-28

HBase

是一個高可靠、高效能、面向列、可伸縮的分散式資料庫,是谷歌BigTable的開源實現,主要用來儲存非結構化和半結構化的鬆散資料。

Hbase優點:

採用面向列(列族)加鍵值對的儲存模式
實現橫向擴充套件
自動資料分片
嚴格的讀寫一致性和自動的故障轉移
全文檢索與過濾
支援命令列、Java、Python等語言操作

表:HBase採用表來組織資料,表由行和列組成,列劃分為若干個列族

行:每個HBase表都由若干行組成,每個行由行鍵(row key)來標識。
列族:一個HBase表被分組成許多“列族”(Column Family)的集合,它是基本的訪問控制單元
列限定符:列族裡的資料通過列限定符(或列)來定位
單元格:在HBase表中,通過行、列族和列限定符確定一個“單元格”(cell),單元格中儲存的資料沒有資料型別,總被視為位元組陣列byte[]
時間戳:每個單元格都儲存著同一份資料的多個版本,這些版本採用時間戳進行索引

 


 客戶端
是整個HBase系統的入口,使用者通過客戶端操作HBase。
使用HBase的RPC機制與Hmaster和RegionServer進行通訊。
Zookeeper
提供分散式協調服務、監控叢集、維護資料總入口,記錄Master節點地址
Master
所有RegionServer管理者、對RegionServer負責的資料範圍進行分配、不負責管理使用者資料表
Region
根據行健對錶中行的分割槽
預設大小:100M—200M

新增HBase節點  


(1)在新節點部署配置HBase軟體,並配置RegionServer  
(2)在HMaster的regionserver配置檔案中新增新節點的host  
(3)在新節點中通過下面命令啟動HRegionServer:      hbase-daemon.sh start regionserver  
(4)在新啟動的節點上,開啟hbase shell,如下設定:      balance_switch true


刪除HBase節點    


在需要刪除的節點執行命令    
hbase-daemon.sh stop regionserver    或     graceful_stop.sh HOSTNAME

相關文章