[Hive]建表例項與引數解釋——自定義表的儲存格式(textfile、sequencefile、refile)
一、建表例項
create external table `beatles_bi_dm.driver_butie_order_info`(
`drive_license_number` bigint COMMENT '1',
`drive_num` bigint COMMENT '2',
`order_num` bigint COMMENT '3',
`coupon_num` bigint COMMENT '4',
`passenger_num` bigint COMMENT '5',
`total_coupon_amount` bigint COMMENT '6'
)
COMMENT '表描述'
PARTITIONED BY (
`event_day` string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
STORED AS orcfile
TBLPROPERTIES('creater'='me') --按鍵值對的格式為表增加額外的文件說明
二、表的儲存格式
1、textfile
預設格式;
儲存方式為行儲存;
磁碟開銷大 資料解析開銷大;
但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作。
2、sequencefile
二進位制檔案,以<key,value>的形式序列化到檔案中;
儲存方式:行儲存;
可分割 壓縮;
一般選擇block壓縮;
優勢是檔案和Hadoop api中的mapfile是相互相容的
3、refile
儲存方式:資料按行分塊 每塊按照列儲存;
壓縮快 快速列存取;
讀記錄儘量涉及到的block最少;
讀取需要的列只需要讀取每個row group 的頭部定義;
讀取全量資料的操作 效能可能比sequencefile沒有明顯的優勢,
4、orcfile
儲存方式:資料按行分塊 每塊按照列儲存;
壓縮快 快速列存取;
效率比rcfile高,是rcfile的改良版本。
相關文章
- MyISAM表的儲存格式---行格式
- Hive之儲存格式Hive
- sql 儲存過程proc中的引數 是 @details 表值 引數型別的時候,如何如何檢視 自定義表的 表結構和欄位資訊SQL儲存過程AI型別
- hive建表Hive
- hive檔案儲存格式Hive
- 表單驗證自定義格式輸出
- 自定義Report 變數儲存功能變數
- DataFrame儲存為hive表時的換行符問題Hive
- 深入mysql建立自定義函式與儲存過程的詳解MySql函式儲存過程
- 用圖表和例項解釋 Await 和 AsyncAI
- mysql 儲存過程 procedure 批次建表MySql儲存過程
- Vue.js自定義指令的用法與例項Vue.js
- css自定義列表計數程式碼例項CSS
- MySQL自定義函式與儲存過程MySql函式儲存過程
- NSUserDefault 儲存自定義物件物件
- vue自定義表單生成器,可根據json引數動態生成表單VueJSON
- 詳解Oracle建立表的引數Oracle
- 傳引數與傳實體、返回實體與返表——三層架構登入例項架構
- 【例項】PowerQuery的自定義日曆
- FineUIMvc隨筆(4)自定義回發引數與自定義回發UIMVC
- 自定義儀表盤
- Flask-sqlalchemy中 backref lazy的引數例項解釋和選擇FlaskSQL
- IDEA自定義類註釋和方法註釋(自定義groovyScript方法實現多行引數註釋)Idea
- mysql優化 | 儲存引擎,建表,索引,sql的優化建議MySql優化儲存引擎索引
- Laravel 自定義配置資訊的儲存方式Laravel
- PostgreSQL獲取建表語句儲存過程SQL儲存過程
- SweetAlert自定義可用引數
- 透過xtts遷移單例項檔案系統表空間到RAC ASM儲存表空間TTS單例ASM
- 通過xtts遷移單例項檔案系統表空間到RAC ASM儲存表空間TTS單例ASM
- InnoDB儲存引擎——表儲存引擎
- 儲存單位表
- Android 自定義 TabActivity 的例項方法Android
- mysql儲存過程經典例項詳解MySql儲存過程
- PostgreSQL:表的儲存屬性SQL
- (Oracle)儲存過程、儲存函式和包的相關知識與例項Oracle儲存過程儲存函式
- Qt5MV自定義模型與例項淺析QT模型
- 流程執行期儲存流程變數的表有哪些變數
- 表在表空間中的儲存情況