Hbase表設計

寧君發表於2020-12-19

Hbase表設計

1. RowKey設計

Rowkey設計三原則

一、rowkey長度原則

越短越好,不要超過16個位元組。

二、rowkey雜湊原則

三、rowkey唯一原則

2.列簇設計

最好一個列簇,命名一個字元足以。

3. 建表高階屬性

1、BLOOMFILTER(布隆過濾器)

使用方法: create 'table',{NAME => 'baseinfo' BLOOMFILTER => 'ROW'}

對 ROW,行鍵的雜湊在每次插入行時將被新增到布隆

對 ROWCOL,行鍵 + 列族 + 列族修飾的雜湊將在每次插入行時新增到布隆

作用:用布隆過濾可以節省讀磁碟過程,可以有助於降低讀取延遲

2、VERSIONS(版本號)

預設是1,老版本資料不重要,就預設。

create 'table',{ NAME => 'baseinfo' VERSIONS=>'2'}

3、COMPRESSION(壓縮)

create 'table',{NAME=>'info',COMPRESSION=>'SNAPPY'} ,建議採用SNAPPY壓縮演算法

4、TTL(Time To Live)

預設是2147483647即:Integer.MAX_VALUE 值大概是68年

相關文章