Hive 優缺點
(一)hive的優點
(1)簡單容易上手:提供了類SQL查詢語言HQL
(2)可擴充套件:為超大資料集設計了計算/擴充套件能力(MR作為計算引擎,HDFS作為儲存系統)
一般情況下不需要重啟服務Hive可以自由的擴充套件叢集的規模。
(3)提供統一的後設資料管理
(4)延展性:Hive支援使用者自定義函式,使用者可以根據自己的需求來實現自己的函式
(5)容錯:良好的容錯性,節點出現問題SQL仍可完成執行
(二)hive的缺點(侷限性)
(1)hive的HQL表達能力有限
1)迭代式演算法無法表達,比如pagerank
2)資料探勘方面,比如kmeans
(2)hive的效率比較低
1)hive自動生成的mapreduce作業,通常情況下不夠智慧化
2)hive調優比較困難,粒度較粗
3)hive可控性差
相關文章
- RabbitMQ優缺點MQ
- MapReduce優缺點
- HTTPS 優點與缺點HTTP
- Docker的優缺點Docker
- 繼承的優缺點繼承
- serverless與容器優缺點Server
- 內聯的優缺點
- HTTP1.1 優缺點HTTP
- MySQL索引的優缺點MySql索引
- hadoop-HDFS優缺點Hadoop
- Ajax原理以及優缺點
- iframe有哪些優點和缺點?
- 繼承的優點和缺點繼承
- MyBatis的優缺點以及特點MyBatis
- 節點快取的優缺點快取
- PyLint 的優點、缺點和危險
- Java單例模式:缺點和優點Java單例模式
- SAP的概念及優缺點
- Kmeans演算法優缺點演算法
- 閉包的概念?優缺點?
- Base64 的優缺點
- kafka的優缺點都有那些Kafka
- 6.iframe的優缺點
- Git版本控制與優缺點Git
- 關於 Cookie的優缺點Cookie
- docker簡介以及優缺點Docker
- HTTP和RPC的優缺點HTTPRPC
- ERP系統有哪些優點和缺點?
- 串列埠、IIC、SPI的優缺點串列埠
- 單頁應用的優缺點
- 雲伺服器的優缺點伺服器
- 也談SAP系統優缺點
- 資料中心代理的優缺點
- 代理伺服器的優缺點伺服器
- 深度學習(Deep Learning)優缺點深度學習
- 物聯網路卡的優缺點
- rem佈局原理和優缺點REM
- 02 SVN 與 Git 的優缺點Git