從零自學Hadoop(23):Impala介紹及安裝

sinodzh發表於2017-05-31

閱讀目錄

本文版權歸mephisto和部落格園共有,歡迎轉載,但須保留此段宣告,並給出原文連結,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 

     上一篇,我們講述了HBase的協處理器。

   下面我們開始介紹Impala的介紹及安裝。

介紹

一:定義

  Impala是Cloudera公司主導開發的新型查詢系統,它提供SQL語義,能查詢儲存在Hadoop的HDFS和HBase中的PB級大資料。和Hive相比,速度快了個數量級,具有非常好的互動式SQL執行。

三:架構

 

Impala Daemon

  是Impala的核心程式,程式名叫做:impalad,執行在所有的資料節點上,可以讀寫資料,並接收客戶端的查詢請求,並行執行來自叢集中其他節點的查詢請求,將中間結果返回給排程節點。呼叫節點將結果返回給客戶端。

Impala Statestore

  狀態管理程式,定時檢查The Impala Daemon的健康狀況,協調各個執行impalad的例項之間的資訊關係,Impala正是通過這些資訊去定位查詢請求所要的資料,程式名叫做 statestored,在叢集中只需要啟動一個這樣的程式,如果Impala節點由於物理原因、網路原因、軟體原因或者其他原因而下線,Statestore會通知其他節點,避免查詢任務分發到不可用的節點上。

Impala Catalog Service

  後設資料管理服務,程式名叫做 catalogd,將資料表變化的資訊分發給各個程式。

安裝

一:新增服務

  

二:勾選Impala

  

三:分配服務

  

  

四:儲存配置

  

五:新增服務進行中

  

 

六:新增完成

  

 

  

 

  

--------------------------------------------------------------------

  到此,本章節的內容講述完畢。

系列索引

  【源】從零自學Hadoop系列索引

 

 

 

 

本文版權歸mephisto和部落格園共有,歡迎轉載,但須保留此段宣告,並給出原文連結,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 

相關文章