Hive中的資料型別以及案例實操

孫晨c發表於2020-10-01

原文網址 : https://www.cnblogs.com/sunbr/p/13759189.html

基本資料型別

在這裡插入圖片描述

對於Hive的String型別相當於資料庫的varchar型別，該型別是一個可變的字串，不過它不能宣告其中最多能儲存多少個字元，理論上它可以儲存2GB的字元數。

集合資料型別

在這裡插入圖片描述
Hive有三種複雜資料型別ARRAY、MAP 和 STRUCT。ARRAY和MAP與Java中的Array和Map類似，而STRUCT與C語言中的Struct類似，它封裝了一個命名欄位集合，複雜資料型別允許任意層次的巢狀。
Map和Struct的區別：Struct中屬性名是不變的！Map中key可以變化的！

案例實操

假設某表有如下一行，我們用JSON格式來表示其資料結構。在Hive下訪問的格式為

{
    "name": "songsong",
    "friends": ["bingbing" , "lili"] ,       //列表Array, 
    "children": {                      //鍵值Map,
        "xiao song": 18 ,
        "xiaoxiao song": 19
    }
    "address": {                      //結構Struct,
        "street": "hui long guan" ,
        "city": "beijing" 
    }
}

基於上述資料結構，我們在Hive裡建立對應的表，並匯入資料。
建立本地測試檔案test.txt

songsong,bingbing_lili,xiao song:18_xiaoxiao song:19,hui long guan_beijing
yangyang,caicai_susu,xiao yang:18_xiaoxiao yang:19,chao yang_beijing

注意：在一個表中，array每個元素之間的分隔符和Map每個Entry之間的分隔符和struct每個屬性之間的分隔符需要一致！

Hive上建立測試表test

create table test(
name string,
friends array<string>,
children map<string, int>,
address struct<street:string, city:string>
)
row format delimited fields terminated by ','
collection items terminated by '_'
map keys terminated by ':'
lines terminated by '\n';

欄位解釋：
row format delimited fields terminated by ',' -- 列分隔符
collection items terminated by '_' --MAP STRUCT 和 ARRAY 的分隔符(資料分割符號)
map keys terminated by ':' -- MAP中的key與value的分隔符
lines terminated by '\n'; -- 行分隔符

匯入文字資料到測試表

hive (default)> load data local inpath ‘/opt/module/datas/test.txt’into table test

訪問三種集合列裡的資料，以下分別是ARRAY，MAP，STRUCT的訪問方式

hive (default)> select friends[1],children['xiao song'],address.city from test
where name="songsong";
OK
_c0     _c1     city
lili    18      beijing
Time taken: 0.076 seconds, Fetched: 1 row(s)

Hive中的集合資料型別
2020-12-20
Hive資料型別
Hive（一）資料型別以及DDL資料定義
2024-09-02
Hive資料型別
hive複雜資料型別的用法
2021-02-25
Hive資料型別
redis-11.資料型別實踐案例
2021-01-25
Redis資料型別
JavaScript中的變數、資料型別以及運算子
2020-10-26
JavaScript變數資料型別
Kafka ACL實現架構以及實操案例剖析
2023-02-20
Kafka架構
資料庫中欄位資料型別以及約束
2020-10-02
資料庫資料型別
Java中的基本資料型別與引用資料型別
2021-01-21
Java資料型別
Java中的資料型別
2019-04-13
Java資料型別
javascript中的資料型別
2020-11-21
JavaScript資料型別
hive學習筆記之一：基本資料型別
2021-07-01
Hive筆記資料型別
JAVA中基本資料型別和引用資料型別
2020-11-09
Java資料型別
JS中其他資料型別轉為number資料型別的方法
2020-01-07
JS資料型別
大資料4.1 - Flume整合案例+Hive資料倉
2018-04-08
大資料Hive
pandas中的series資料型別
2019-01-18
資料型別
大資料開發之Mapper Reduce序列化案例實操
2020-12-21
大資料APP
說說 Python 的變數以及簡單資料型別
2021-09-09
Python變數資料型別
JavaScript中的資料型別-儲存差別
2024-09-05
JavaScript資料型別
Redis多種資料型別以及使用場景
2021-09-30
Redis資料型別
【OpenCV教程】OpenCV中的資料型別
2024-08-18
OpenCV資料型別
PHP7中的資料型別
2021-09-09
PHP資料型別
MySQL中資料型別的驗證
2021-09-09
MySql資料型別
ASO怎麼做？經驗方法、免費工具以及實操案例分享
2019-06-05
Spark SQL：Hive資料來源複雜綜合案例實戰
2018-09-28
SparkSQLHive
[hive]hive資料模型中四種表
2018-08-14
Hive模型
js資料型別之基本資料型別和引用資料型別
2018-06-19
JS資料型別
資料型別: 資料型別有哪些？
2021-02-01
資料型別
Redis(二) 資料型別操作指令以及對應的RedisTemplate方法
2021-06-08
Redis資料型別
數值的擴充套件方法以及新增資料型別BigInt
2023-02-21
套件資料型別
自主資料型別：在TVM中啟用自定義資料型別探索
2020-12-16
資料型別
變數以及八大資料型別介紹
2024-03-28
變數大資料資料型別
Java中的資料型別和運算子
2020-11-16
Java資料型別
1-02：MySQL中的資料型別
2018-12-30
MySql資料型別
Hive -------- 使用mysql儲存hive後設資料，Mysql的安裝以及配置步驟
2018-11-12
HiveMySql
區別值型別資料和引用型別資料
2018-05-30
型別
JS中資料型別轉換
2018-06-06
JS資料型別
資料型別是什麼?Python的資料型別又有哪些？
2022-04-29
資料型別Python
MySQL 的資料型別
2020-01-11
MySql資料型別

Hive中的資料型別以及案例實操

基本資料型別

集合資料型別

案例實操

相關文章