在資料倉儲中如何做分割槽表
- 為什麼做分割槽
分割槽表將資料組織成分割槽,主要可以提高資料的查詢速度。
如果把一年或者一個月的日誌檔案存放在一個表下,那麼資料量會非常的大,當查詢這個表中某一天的日誌檔案的時候,查詢速度還非常的慢,這時候可以採用分割槽表的方式,把這個表根據時間點再劃分為小表。這樣劃分後,查詢某一個時間點的日誌檔案就會快很多,因為這是不需要進行全表掃描。
Hive中的分割槽是根據“分割槽列”的值對錶的資料進行粗略的劃分,Hive中一個表對應一個目錄,再根據分割槽列在這個表目錄下建立子目錄,每個子目錄名就是分割槽列的名字。分割槽列定義與表中欄位相似,但是與表中的欄位無關,是獨立的列。這樣就加快了資料查詢的速度,因為不會對這個表中進行全盤掃描了。
- 如何做分割槽
(1)建表語句
create table if not exists latte_d_test
(
uid string comment "使用者ID",
vld_flg string comment "該條記錄是否有效,1-有效,0-無效"
)
COMMENT "test表"
PARTITIONED BY (day STRING);
(2)設定分割槽表引數
set hive.exec.dynamic.partition = true;
設定為true表示開啟動態分割槽功能(預設為false)。
set hive.exec.dynamic.partition.mode = nonstrict;
設定為nonstrict,表示允許所有分割槽都是動態的(預設為strict)。
(3)插入資料
insert overwrite table latte_d_test partition(day)
select uid,
'1',
'2016-10-10'
from test
相關文章
- MySQL的nnodb引擎表資料分割槽儲存MySql
- 使用expdp匯出分割槽表中的部分分割槽資料
- 分割槽表入無分割槽的資料庫資料庫
- 自動備份、截斷分割槽表分割槽資料
- 資料表分割槽分割與刪除歷史資料
- MySQL資料表分割槽手記MySql
- 海量資料處理_表分割槽
- 分割槽表匯入資料庫資料庫
- 資料庫分割槽表 什麼情況下需要分割槽資料庫
- postgresql分割槽表修改資料表欄位SQL
- Hash分割槽表分割槽數與資料分佈的測試
- Oracle中重建表分割槽Oracle
- 資料倉儲中的分析SQL——資料倉儲手冊SQL
- ORACLE刪除-表分割槽和資料Oracle
- hive 動態分割槽插入資料表Hive
- Hash分割槽表及資料分佈
- 資料倉儲——在“啤酒與尿布”中挖掘 (轉)
- oracle分割槽表和分割槽表exchangeOracle
- 海量資料處理_表分割槽(分割槽自動維護與歷史分割槽歸檔)
- 資料倉儲之拉鍊表
- 全面學習分割槽表及分割槽索引(13)--分隔表分割槽索引
- oracle分割槽表和非分割槽表exchangeOracle
- 詳解ORACLE資料庫的分割槽表Oracle資料庫
- 匯入匯出 Oracle 分割槽表資料Oracle
- 資料倉儲中的概念
- Oracle分割槽表及分割槽索引Oracle索引
- INTERVAL分割槽表鎖分割槽操作
- 全面學習分割槽表及分割槽索引(9)--刪除表分割槽索引
- 全面學習分割槽表及分割槽索引(11)--合併表分割槽索引
- 全面學習分割槽表及分割槽索引(12)--修改list表分割槽索引
- 學習筆記】分割槽表和分割槽索引——新增表分割槽(二)筆記索引
- 在 Apache Cassandra 中定義和最佳化資料分割槽Apache
- 插入遠端資料庫資料遇到分割槽表bug資料庫
- 如何查詢分割槽表的分割槽及子分割槽
- 資料庫分割槽表分割槽未分配導致的一些問題資料庫
- MySql資料分割槽操作之新增分割槽操作MySql
- 使用split對分割槽表再分割槽
- 簡單ORACLE分割槽表、分割槽索引Oracle索引