Hive學習筆記 1 Hive體系結構

土豆拍死馬鈴薯發表於2017-10-08

本Hive學習筆記是觀看慕課網趙強的教程後的筆記,教程地址:http://www.imooc.com/learn/387


什麼是Hive?

Hive是基於Hadoop HDFS之上的資料倉儲,本質上就是一個資料庫。


什麼是資料倉儲?


面向主題:資料倉儲中的資料是使用者進行資料分析時關心的資料

整合的:資料倉儲中的資料是來自於分散的資料來源,有可能來自於Mysql 、Oracle、文字檔案等

不可更新的:主要是決策分析,所涉及到的操作主要是資料的查詢,一般不涉及更新和刪除

隨時間不變化


資料倉儲的結構和建立過程?



OLTP 和 OLAP?

OLTP:聯機事務處理,關注的焦點是事務的處理,如銀行的轉賬系統,扣錢和加錢要麼都成功,要麼都不成功

OLAP:聯機分析處理,典型的是商品推薦系統,主要做查詢


資料倉儲中的資料模型?

星型模型:



雪花模型:











Hive的後設資料?





一條HQL語句的執行過程?




Hive的體系結構?




相關文章