hive學習筆記之一：基本資料型別

程式設計師欣宸發表於2021-07-01

原文網址 : https://www.cnblogs.com/bolingcavalry/p/14957069.html

Hive筆記資料型別

歡迎訪問我的GitHub

https://github.com/zq2599/blog_demos

內容：所有原創文章分類彙總及配套原始碼，涉及Java、Docker、Kubernetes、DevOPS等；

《hive學習筆記》系列導航

關於hive學習筆記系列

《hive學習筆記》系列保持了作者一貫的風格，即通過實戰學習和了解；
作為一個構建在Hadoop上的資料倉儲框架，hive被用來進行資料提取、轉化、載入，這是一種可以儲存、查詢和分析儲存在Hadoop中的大規模資料的機制，hive資料倉儲工具能將結構化的資料檔案對映為一張資料庫表，並提供SQL查詢功能，能將SQL語句轉變成MapReduce任務來執行。(來自：《Hadoop應用開發實戰詳解（修訂版）》)
架構如下，可見最終還是在執行MapReduce：

在這裡插入圖片描述

環境資訊

本文對應的環境資訊如下：

CentOS Linux release 7.5.1804
JDK：1.8.0_191
hadoop：2.7.7
hive：1.2.2

關於hive的部署

需要先部署hadoop環境，請參考《Linux部署hadoop2.7.7叢集》
hadoop部署成功後，安裝和體驗hive其參考《安裝和體驗hive》

資料型別簡介

Hive支援基本和複雜資料型別：

基本資料型別：包括數值型、布林型、字串型別和時間戳型別；
複雜資料型別：陣列、對映、結構；

基本資料型別

通過思維導圖來分類和理解：

在這裡插入圖片描述

下面通過列表說明所有的基本資料型別：

型別	描述	示例
BOOLEAN	true/false	TRUE
TINYINT	1位元組有符號整數，從-128到127	1Y
SMALLINT	2位元組有符號整數,從-32768到32767	1S
INT	4位元組有符號整數,從-2147483648到2147483647	1
BIGINT	8位元組有符號整數, 從-9223372036854775808到9223372036854775807	1L
FLOAT	4位元組單精度浮點數	1.0
DOUBLE	8位元組(64位)雙精度浮點數	1.0
DECIMAL	任意精度有符號小數	1.0
STRING	無上限可變長度字串	'a', "a"
VARCHAR	可變長度字串	'a', "a"
CHAR	固定長度字串	'a', "a"
BINARY	位元組陣列	-
TIMESTAMP	精度到納秒的時間戳	'2020-03-01 00:00:00'
DATE	日期	'2020-01-01'

關於三種字串型別

STRING，變長，無需最大長度宣告，理論上能儲存2GB字元；
VARCHAR，變長，需要宣告最大長度（1到65535之間），例如VARCHAR(100)；
CHAR，定長，如CHAR(100)；

常用型別綜合實戰

啟動hive，進入互動模式，執行以下語句建表，欄位型別是常用的幾種：

create table t1(
int_field  INT,
string_field STRING,
boolean_field BOOLEAN,
date_field DATE,
timestamp_field TIMESTAMP
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY  '\t'
STORED AS TEXTFILE;

用insert語句新增一條記錄：

insert into t1 
values 
(101, 'a101', true, '2020-01-01', '2020-03-01 00:00:00');

使用函式，在新增的記錄的時候，將timestamp_field欄位設定為當前時間，注意和前面的insert語句比較一下，使用函式時必須用到select XXX from XXX limit 1這樣的語法：

insert into t1 
select 
103, 'a103', true, '2020-01-01', current_timestamp() 
from t1 limit 1;

看一下新增的兩條記錄：

hive> select * from t1;
OK
101	a101	true	2020-01-01	2020-03-01 00:00:00
103	a103	true	2020-01-01	2020-10-27 20:42:35.729
Time taken: 0.062 seconds, Fetched: 2 row(s)

檢視當前時間：

select unix_timestamp();

響應：

hive> select unix_timestamp();
OK
1603802631
Time taken: 0.028 seconds, Fetched: 1 row(s)

將DATE欄位轉為TIMESTAMP：

select cast(date_field as timestamp) from t1;

響應：

hive> select cast(date_field as timestamp) from t1;
OK
2020-01-01 00:00:00
2020-01-01 00:00:00
Time taken: 0.051 seconds, Fetched: 2 row(s)

將TIMESTAMP欄位轉為DATE：

select to_date(timestamp_field) from t1;

響應：

hive> select to_date(timestamp_field) from t1;
OK
2020-03-01
2020-10-27
Time taken: 0.063 seconds, Fetched: 2 row(s)

將TIMESTAMP欄位轉為BIGINT：

select to_date(timestamp_field) from t1;

響應：

hive> select to_date(timestamp_field) from t1;
OK
2020-03-01
2020-10-27
Time taken: 0.063 seconds, Fetched: 2 row(s)

至此，hive的基本資料型別已經瞭解，接下來的章節我們們一起學習瞭解複雜資料型別；

參考文件

https://stackoverflow.com/questions/37863194/insert-timestamp-into-hive/37868132

你不孤單，欣宸原創一路相伴

歡迎關注公眾號：程式設計師欣宸

微信搜尋「程式設計師欣宸」，我是欣宸，期待與您一同暢遊Java世界...

Python學習筆記2：基本資料型別
2020-11-13
Python筆記資料型別
python學習筆記1—python的基本資料型別
2019-02-16
Python筆記資料型別
TS學習筆記（一）：基本型別
2019-04-20
筆記型別
Python 學習筆記——資料型別
2020-11-25
Python筆記資料型別
Python3學習筆記1，基本資料型別-Number、str
2018-07-02
Python筆記資料型別
Flutter學習筆記（3）--Dart變數與基本資料型別
2019-07-09
Flutter筆記Dart變數資料型別
Python學習筆記(一) 資料型別
2018-08-01
Python筆記資料型別
Python3學習筆記2，基本資料型別-list、tuple、set、dict
2018-07-02
Python筆記資料型別
Python 3 學習筆記之——資料型別
2018-10-23
Python筆記資料型別
Redis學習筆記（二）——Redis資料型別
2018-08-18
Redis筆記資料型別
redis學習筆記2: Redis資料型別
2024-05-14
Redis筆記資料型別
Java學習筆記8-資料型別
2024-08-23
Java筆記資料型別
Python學習教程：基本資料型別
2020-06-01
Python資料型別
java基礎之一：基本資料型別
2020-11-30
Java資料型別
Python3學習（基本資料型別-集合-字典-基本資料型別總結）
2018-10-25
Python資料型別
OpenCV學習筆記（3）——Scalar資料型別理解
2020-04-05
OpenCV筆記資料型別
JavaScript筆記5：計時器、物件、基本資料型別、引用資料型別
2020-10-18
JavaScript筆記物件資料型別
自學java筆記I 基本型別+轉義字元+資料型別的轉換
2018-09-12
Java筆記字元資料型別
PHP基本語法學習 [資料型別]
2020-10-07
PHP資料型別
第二週學習--基本資料型別
2021-09-09
資料型別
Redis學習筆記 – 資料型別與API（1）Key
2018-03-13
Redis筆記資料型別API
Redis In Action 筆記（一）：基本資料型別及其操作
2019-06-07
Redis筆記資料型別
Python3學習-（基本資料型別-列表）
2018-10-23
Python資料型別
Python3學習-（基本資料型別-字串）
2018-10-22
Python資料型別字串
Go語言學習(4) - 基本資料型別
2018-11-26
Go資料型別
Python學習教程之基本資料型別字串
2021-06-10
Python資料型別字串
GO語言學習——基本資料型別字串
2022-04-16
Go資料型別字串
SAP UI5 資料型別(data type) 學習筆記
2022-03-25
UI資料型別筆記
TypeScript學習筆記（一）環境搭建和資料型別
2021-08-08
TypeScript筆記資料型別
資料型別 - Go 學習記錄
2019-02-25
資料型別Go
Laravel 學習筆記之一：備份資料以及資料填充
2020-07-05
Laravel筆記
Go型別特性-學習筆記
2018-06-27
Go型別筆記
c++基本型別筆記
2018-06-04
C++型別筆記
Hive學習之型別轉化
2018-12-02
Hive型別
[python學習手冊-筆記]002.python核心資料型別
2020-11-14
Python筆記資料型別
Java個人學習筆記-資料型別及取值範圍
2021-09-09
Java筆記資料型別
MySQL資料型別筆記
2020-05-10
MySql資料型別筆記
python筆記--資料型別
2021-09-09
Python筆記資料型別

hive學習筆記之一：基本資料型別

歡迎訪問我的GitHub

《hive學習筆記》系列導航

關於hive學習筆記系列

環境資訊

關於hive的部署

資料型別簡介

基本資料型別

關於三種字串型別

常用型別綜合實戰

參考文件

你不孤單，欣宸原創一路相伴

歡迎關注公眾號：程式設計師欣宸

相關文章