一、瞭解Hbase
1、什麼是hbase?
HBase是一個高可靠性,高效能、面向列,可伸縮的分散式儲存系統,用於儲存海量結構化或者半結構化,非結構化的資料(底層是位元組陣列做儲存的)
二、HBase相關概念
1、資料模型(三維有序)
- 一個hbase表中,行鍵之間是按照字典順序排序的
- 一行中每一個列名按照字典順序
- 同一個列多個版本號資料,版本之間是按照字典順序排序的
2、Hbase資料座標
HBase中需要根據行鍵、列族、列限定符和時間戳來確定一個單元格(cell),cell中的資料是沒有型別的,全部是位元組碼形式存貯。,因此,可以視為一個“四維座標”,即[行鍵, 列族, 列限定符, 時間戳]。
3、HBase區域
HBase自動把表水平劃分為區域(Region),每個區域都是有若干連續行構成的,一個區域由所屬的表、起始行、終止行(不包括這行)三個要素來表示。
三、Hbase系統架構
四、HBase安裝搭建
1、先在官網上下載對應版本的HBase
這裡我們下載hbase-2.2.7
hbase-2.2.7-bin.tar.gz
2、上傳解壓到lunix虛擬機器上
tar -zxvf hbase-1.4.6-bin.tar.gz
3、配置環境變數
export HBASE_HOME=/usr/local/soft/hbase-1.4.6
$HBASE_HOME/bin
配置完之後一定要source /etc/profile
4、修改hbase-env.sh檔案
1、增加java配置
export JAVA_HOME=/usr/local/soft/jdk1.8.0_171
2、關閉預設zk配置(原本是註釋的,放開修改false)
export HBASE_MANAGES_ZK=false
5、修改hbase-site.xml檔案
修改以下配置
增加以下配置
6、修改regionservers檔案
改為:
node1
node2
7、同步到所有節點
scp -r hbase-1.4.6 node1:pwd
scp -r hbase-1.4.6 node2:pwd
8、最後啟動HBase
1、先啟動zkServer
zkServer.sh start
所有節點都需要啟動
2、啟動hadoop
只需要在主節點master上啟動
start-all.sh
3、啟動Hbase
start-hbase.sh
出現如下程序說明啟動成功!!!
4、進入hbase
hbase shell