[Hive]建表例項與引數解釋——自定義表的儲存格式(textfile、sequencefile、refile)
一、建表例項
create external table `beatles_bi_dm.driver_butie_order_info`(
`drive_license_number` bigint COMMENT '1',
`drive_num` bigint COMMENT '2',
`order_num` bigint COMMENT '3',
`coupon_num` bigint COMMENT '4',
`passenger_num` bigint COMMENT '5',
`total_coupon_amount` bigint COMMENT '6'
)
COMMENT '表描述'
PARTITIONED BY (
`event_day` string)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
STORED AS orcfile
TBLPROPERTIES('creater'='me') --按鍵值對的格式為表增加額外的文件說明
二、表的儲存格式
1、textfile
預設格式;
儲存方式為行儲存;
磁碟開銷大 資料解析開銷大;
但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作。
2、sequencefile
二進位制檔案,以<key,value>的形式序列化到檔案中;
儲存方式:行儲存;
可分割 壓縮;
一般選擇block壓縮;
優勢是檔案和Hadoop api中的mapfile是相互相容的
3、refile
儲存方式:資料按行分塊 每塊按照列儲存;
壓縮快 快速列存取;
讀記錄儘量涉及到的block最少;
讀取需要的列只需要讀取每個row group 的頭部定義;
讀取全量資料的操作 效能可能比sequencefile沒有明顯的優勢,
4、orcfile
儲存方式:資料按行分塊 每塊按照列儲存;
壓縮快 快速列存取;
效率比rcfile高,是rcfile的改良版本。
相關文章
- sql 儲存過程proc中的引數 是 @details 表值 引數型別的時候,如何如何檢視 自定義表的 表結構和欄位資訊SQL儲存過程AI型別
- hive檔案儲存格式Hive
- hive建表Hive
- 表單驗證自定義格式輸出
- 用圖表和例項解釋 Await 和 AsyncAI
- DataFrame儲存為hive表時的換行符問題Hive
- Vue.js自定義指令的用法與例項Vue.js
- 深入mysql建立自定義函式與儲存過程的詳解MySql函式儲存過程
- mysql 儲存過程 procedure 批次建表MySql儲存過程
- vue自定義表單生成器,可根據json引數動態生成表單VueJSON
- MySQL自定義函式與儲存過程MySql函式儲存過程
- Flask-sqlalchemy中 backref lazy的引數例項解釋和選擇FlaskSQL
- hive表中yyyymmdd格式日期校驗Hive
- IDEA自定義類註釋和方法註釋(自定義groovyScript方法實現多行引數註釋)Idea
- 使用SpringBoot JPA進行自定義的儲存及批量儲存Spring Boot
- Qt5MV自定義模型與例項淺析QT模型
- Flink 自定義維表
- mysql優化 | 儲存引擎,建表,索引,sql的優化建議MySql優化儲存引擎索引
- 自定義註解例項實現SQL語句生成SQL
- PostgreSQL獲取建表語句儲存過程SQL儲存過程
- Hibernate中的自動建表及引數作用
- 使用SpringBoot-JPA進行自定義的儲存及批量儲存Spring Boot
- PostgreSQL:表的儲存屬性SQL
- 可變引數例項
- Laravel 自定義配置資訊的儲存方式Laravel
- 流程執行期儲存流程變數的表有哪些變數
- oracle 例項表查詢Oracle
- PHP 完整表單例項PHP單例
- elementUI 2.0.11自定義表頭UI
- elementUI table 自定義表頭UI
- LMT下表儲存引數的使用
- mysql儲存過程的引數MySql儲存過程
- C#雜湊表的例項C#
- PHP 自定義session儲存 FILE 方式類PHPSession
- PostgreSQL:所有支援的資料型別及建表語句例項SQL資料型別
- 2.15 自定義表單文字框內容的格式 [iOS開發中的神兵利器]iOS
- PHP 編譯引數儲存PHP編譯
- oracle使用儲存過程將表資料以excel格式匯出Oracle儲存過程Excel