Hadoop 工具的認識
2018-5-18【來源網路】
在眾多大資料框架中,Impala定位類似Hive,不過Impala更關注即席查詢SQL的快速解析,對於執行時間過長的SQL,仍舊是Hive更合適。對於GroupBy等SQL查詢,Impala進行的是記憶體計算,因而Impala對機器配置要求較高,官方建議記憶體128G以上,此類問題Hive底層對應的是傳統的MapReduce計算框架,雖然執行效率低,但是穩定性好,對機器配置要求也低。
執行效率是Impala的最大優勢,對於儲存在HDFS中的資料,Impala的解析速度本來就遠快於Hive,有了Kudu加成之後,更是如虎添翼,部分查詢執行速度差別可達百倍。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/554557/viewspace-2154685/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 從零自學Hadoop(01):認識HadoopHadoop
- 認識UML工具
- DevOps基礎的認識與工具實踐dev
- Hadoop的fsck工具Hadoop
- HttpModule的認識HTTP
- 認識Java專案開發效率工具 LombokJavaLombok
- Python語言認識和實用工具(1)Python
- 認識一下HTTP抓包工具FiddlerHTTP
- 認識Windows的域Windows
- 圖形的認識
- 關於UI設計行業的認識再到認識UI行業
- Hadoop 許可權認證Hadoop
- Cloudera hadoop認證總結CloudHadoop
- 認識CopyOnWriteArrayList
- 認識DockerDocker
- 認識jqueryjQuery
- JQuery認識jQuery
- 認識 TypeScriptTypeScript
- 【認識JavaScript】JavaScript
- 認識WebGLWeb
- 認識RedisRedis
- 認識htmlHTML
- 認識JS中的ClassJS
- 對C++的認識C++
- 軟體工程的認識軟體工程
- 認識oracle的update更新Oracle
- 新手知識:認識(轉)
- 認識 Cargo-Rust構建工具和包管理器CargoRust
- Hadoop叢集機器的SSH認證配置Hadoop
- Hadoop基礎知識Hadoop
- 學習/認識CPU的GDT
- package.json的認識PackageJSON
- spring 啟動的認識Spring
- 【雜談】對CopyOnWriteArrayList的認識
- 我認識的python(4)Python
- 我認識的python(5)Python
- 對深度學習的認識深度學習
- 快速冪的初步認識(Java)Java