Hive之儲存格式
hive檔案儲存格式包括以下幾類:TEXTFILE、SEQUENCEFILE、RCFILE、自定義格式
其中TEXTFILE為預設格式,建表時不指定預設為這個格式,匯入資料時會直接把資料檔案拷貝到hdfs上不進行處理。SequenceFile,RCFile格式的表不能直接從本地檔案匯入資料,資料要先匯入到textfile格式的表中,然後再從TextFile表中用insert匯入到SequenceFile,RCFile表中。
1 TEXTFIEL
預設格式,資料不做壓縮,磁碟開銷大,資料解析開銷大。可結合Gzip、Bzip2使用(系統自動檢查,執行查詢時自動解壓),但使用這種方式,hive不會對資料進行切分,從而無法對資料進行並行操作。
示例:
hive (default) > create table user_id (user_id string)
> stored as TextFile;
OK
Time taken: 0.143 seconds
2 SEQUENCEFILE
SequenceFile是Hadoop API提供的一種二進位制檔案支援,其具有使用方便、可分割、可壓縮的特點。SequenceFile支援三種壓縮選擇:NONE, RECORD, BLOCK。 Record壓縮率低,一般建議使用BLOCK壓縮。
示例:
hive (default)> create table user_id (user_id string)
> stored as SequenceFile;
OK
Time taken: 0.14 seconds
3 RCFILE
RCFILE是一種行列儲存相結合的儲存方式。首先,其將資料按行分塊,保證同一個record在一個塊上,避免讀一個記錄需要讀取多個block。其次,塊資料列式儲存,有利於資料壓縮和快速的列存取。
示例:
hive (default)> create table user_id (user_id string)
> stored as RcFile;;
OK
Time taken: 0.174 seconds
4 自定義格式
當使用者的資料檔案格式不能被當前 Hive 所識別的時候,可以自定義檔案格式。使用者可以通過實現inputformat和 outputformat來自定義輸入輸出格式,由於目前使用的Hadoop版本為CDH,無法找到原始碼,自定義資料格式(如有解決方法,及時更新)
相關文章
- hive檔案儲存格式Hive
- 好程式設計師大資料學習路線之hive儲存格式程式設計師大資料Hive
- hive從入門到放棄(六)——常用檔案儲存格式Hive
- 掌握Hive資料儲存模型Hive模型
- Mysql 行的儲存格式MySql
- Nebula Storage 2.0 儲存格式
- OceanBase 原始碼解讀(九):儲存層程式碼解讀之「巨集塊儲存格式」原始碼
- [Hive]建表例項與引數解釋——自定義表的儲存格式(textfile、sequencefile、refile)Hive
- OceanBase 儲存層程式碼解讀(二)微塊儲存格式
- OceanBase 儲存層程式碼解讀(三)巨集塊儲存格式
- hive學習之四:hive檔案格式以及壓縮編碼Hive
- oracle儲存過程書寫格式Oracle儲存過程
- redis-5.資料儲存格式Redis
- 好程式設計師大資料培訓分享之hive儲存過程程式設計師大資料Hive儲存過程
- Hive的壓縮儲存和簡單優化Hive優化
- Flutter持久化儲存之檔案儲存Flutter持久化
- Kafka-之資料日誌儲存(格式變化與壓縮)Kafka
- Greenplum 效能優化之路 --(二)儲存格式優化
- 如何將網頁儲存成mhtml格式網頁HTML
- Flutter持久化儲存之資料庫儲存Flutter持久化資料庫
- Flutter持久化儲存之key-value儲存Flutter持久化
- Hive 如何方便地實現儲存過程?Hive儲存過程
- Hive -------- 使用mysql儲存hive後設資料,Mysql的安裝以及配置步驟HiveMySql
- Android中的資料儲存之檔案儲存Android
- k8s之資料儲存-配置儲存K8S
- 比較 Apache Hadoop 資料儲存格式 - techwellApacheHadoop
- Spark原始碼編譯支援Parquet儲存格式Spark原始碼編譯
- DataFrame儲存為hive表時的換行符問題Hive
- MySQL之四 儲存引擎MySql儲存引擎
- 儲存資料之SharedPreference
- newsql新品TiDB之儲存SQLTiDB
- MySQL之儲存過程MySql儲存過程
- k8s之資料儲存-高階儲存K8S
- Hive資料格式轉換Hive
- 物件儲存、檔案儲存、塊儲存這三者之間有什麼區別?物件
- HDU-安卓程式開發之簡單儲存/內部儲存/外部儲存 & 捉蟲安卓
- Impala之儲存和壓縮
- kubernetes系列(十三) - 儲存之Volume
- kubernetes系列(十二) - 儲存之Secret