Hive 優缺點

一塵在心發表於2018-08-21

(一)hive的優點

(1)簡單容易上手:提供了類SQL查詢語言HQL

(2)可擴充套件:為超大資料集設計了計算/擴充套件能力(MR作為計算引擎,HDFS作為儲存系統)

一般情況下不需要重啟服務Hive可以自由的擴充套件叢集的規模。

(3)提供統一的後設資料管理

(4)延展性:Hive支援使用者自定義函式,使用者可以根據自己的需求來實現自己的函式

(5)容錯:良好的容錯性,節點出現問題SQL仍可完成執行

(二)hive的缺點(侷限性)

(1)hive的HQL表達能力有限

1)迭代式演算法無法表達,比如pagerank

2)資料探勘方面,比如kmeans

(2)hive的效率比較低

1)hive自動生成的mapreduce作業,通常情況下不夠智慧化

2)hive調優比較困難,粒度較粗

3)hive可控性差

相關文章