Hive9 索引

Auraros發表於2020-10-12

Hive9 索引

更多整理都在我的github上:Auraros歡迎大家。

建立索引

  • 先簡歷一張表
CREATE TABLE employees(
	name			STRING,
	salary			FLOAT,
	subordinates	ARRAY<STRING>,
	deductions		MAP<STRING, FLOAT>,
	adress			STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>
	)
    PARTITION BY (country STRING, state STRING);
  • 對分割槽建立索引
CREATE INDEX employees_index
ON TABLE employees(country)
AS 'org.apache.hadoop.hive.ql.index.compact.CompactIndexHandler'
WITH DEFERED REBUILD
IDXPROPERTIES ('creator' = 'me', 'ceated_at' = 'some_time')
IN TABLE employees_index_table
PARTITIONED BY (country, name)
COMMENT 'Employees indexed by country and name.';

AS: 語句制定了索引處理器,也就是實現了索引介面的JAVA類,Hive本身包含了一些典型的索引實現。

IN TABLE:要求索引處理器在一張新表中保留索引資料。

Bitmap索引

bitmap索引普遍應用於排重後較少的列。

CREATE INDEX employees_index
ON TABLE employees(country)
AS 'BITMAP'
WITH DEFERRED REBUILD
IDXPROPERTIED('creator' = 'me', 'ceated_at' = 'some_time')
IN TABLE employees_index_table
PARTITIONED BY (country, name)
COMMENT 'Employees indexes by country and name.';

重建索引

如果使用者指定了 DEFERRED REBUILD ,那麼新索引將呈現空白狀態,在任何時候,都可以進行第一次索引建立或者使用 ALTER INDEX對索引進行重建。

ALTER INDEX employees_index
ON TABLE employees
PARTITION (country = 'US')
REBUILD;

如果忽略掉PARTITION ,那麼將會對所有分割槽進行重建索引。

顯示索引

SHOW FORMATTED INDEX ON employees;

關鍵字FORMATTED是可選的,增加這個關鍵字可以使輸出中包含有列名稱。使用者還可以替換INDEX 為 INDEXES。

刪除索引

DROP INDEX IF EXISTS employees_index ON TABLE employees;

相關文章