初識Hive:3張圖瞭解Hive的資料型別、架構圖!

shenmanli發表於2017-10-18
Hive是一個構建在Hadoop上的資料倉儲框架,可以將結構化的資料檔案,對映為一張資料庫表,並提供完整的sql查詢功能。可以將sql語句,轉換為MapReduce任務進行執行。


Hive選擇Hadoop來儲存和處理資料,因為Hadoop有較好的價效比。Hive設計的目標是讓精通SQL技能(Java較弱的)分析師,能夠從存放在HDFS的大規模資料集上,執行查詢。


Hive 一般在工作站上執行,將SQL查詢轉換為一系列MapReducejob,在Hadoopcluster上執行。


表模式等後設資料存放在名為metastore的資料庫中。預設的metastore在本地執行。此時建立的Hive表在本地上,無法與其它使用者共享。


Hive優點


Hive學習成本低,可以通過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合資料倉儲的統計分析。


安裝和啟動Hive


解壓縮:
$ tar xvzfhive-1.X.X-dev.tar.gz


配置路徑:
export HIVE_INSTALL=/home/hadoop-2.X/hive
export PATH=$PATH:$HIVE_INSTALL/bin


啟動Hive shell:
$ hive
hive>


Hive資料型別



SQL和HiveQL的概要比較



Hive客戶端


如果以伺服器方式執行:
hive –service hiveserver2


可以在應用程式中,以不同機制連線到伺服器:
nmaplocalhost
ufwdisable


Hive架構

相關文章