hive 的使用
hive是基於Hadoop的一個資料倉儲工具,可以將結構化的資料檔案對映為一張資料庫表,並提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行執行。 其優點是學習成本低,可以透過類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合資料倉儲的統計分析。
Hive是建立在 Hadoop 上的資料倉儲基礎構架。它提供了一系列的工具,可以用來進行資料提取轉化載入(ETL),這是一種可以儲存、查詢和分析儲存在 Hadoop 中的大規模資料的機制。Hive 定義了簡單的類 SQL 查詢語言,稱為 HQL,它允許熟悉 SQL 的使用者查詢資料。同時,這個語言也允許熟悉 MapReduce 開發者的開發自定義的 mapper 和 reducer 來處理內建的 mapper 和 reducer 無法完成的複雜的分析工作。
Hive 沒有專門的資料格式。 Hive 可以很好的工作在 Thrift 之上,控制分隔符,也允許使用者指定資料格式。
Hive是:提供一個大資料的SQL的介面,不做計算。用來做資料分析。
在這種模式下,hive metastore 服務跟HiveServer程式共用一個程式,但是會另起一個執行緒來執行後設資料資料庫,這個執行緒有可能在另外一個機器上。內建的metastore服務跟metastore資料庫之間透過JDBC互動。比上一個方案更進一步了,但是還是不夠好,因為hive metastore跟HiveServer還共用一個程式呢,於是來介紹下CDH強烈推薦的第三種模式
在這種模式下,Hive metastore 服務執行在獨立的jvm程式裡面。 HiveServer2, HCatalog, Cloudera Impala™, 和其他程式透過 Thrift 的網路 API (在 hive.metastore.uris 屬性裡面配置)來跟它通訊。metastore 服務跟儲存 metastore 的資料庫之間透過JDBC (用 javax.jdo.option.ConnectionURL 屬性配置)通訊. 資料庫 , HiveServer 程式,和 metastore 服務可以執行在同一個機子上,但是如果把 HiveServer程式執行在另一臺機器上會更高的可用性(就是不要把雞蛋放在一個籃子裡啦)和擴充套件性。
————————————————
推薦閱讀:
原文連結:https://blog.csdn.net/nsrainbow/article/details/41748863
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949806/viewspace-2901331/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- hive beeline使用Hive
- 使用hive增量更新Hive
- Hive --------- hive 的優化Hive優化
- 【HIVE】hive 使用shell指令碼跑歷史資料Hive指令碼
- Hadoop實戰:Hive操作使用HadoopHive
- hive視窗函式使用Hive函式
- 一起學Hive——使用MSCK命令修復Hive分割槽Hive
- Hive -------- 使用mysql儲存hive後設資料,Mysql的安裝以及配置步驟HiveMySql
- Hive學習之Hive的安裝Hive
- [Hive]呼叫本地模式,避免使用MapReduceHive模式
- 使用docker快速搭建hive環境DockerHive
- hive使用報錯解決方法Hive
- Apache Hive-2.3.0 快速搭建與使用ApacheHive
- [Hive]Hive排序優化Hive排序優化
- Hive的安裝Hive
- hive的優化Hive優化
- Linux環境Hive安裝配置及使用LinuxHive
- 【Hive】hive資料遷移Hive
- [Hive]Hive中表連線的優化,加快查詢速度Hive優化
- Hive on Spark和Spark sql on Hive,你能分的清楚麼HiveSparkSQL
- Hive on Spark 和 Spark sql on Hive,你能分的清楚麼HiveSparkSQL
- HIVEHive
- Hive——分桶的理解Hive
- Hive表的基本操作Hive
- 【Hive一】Hive安裝及配置Hive
- Flume和Hive整合之hive sinkHive
- 使用go語言開發hive匯出工具GoHive
- hive使用者標籤體系的任務怎麼寫Hive
- Hive -------- hive常見查詢練習Hive
- HIVE基本語法以及HIVE分割槽Hive
- [Hive]Hive實現抽樣查詢Hive
- flink實戰--讀寫Hive(Flink on Hive)Hive
- hive匯出到csv hive匯出到excelHiveExcel
- spark with hiveSparkHive
- 【hive】中的concat函式Hive函式
- Hive與Impala的異同Hive
- Hive||beeline連線的InvalidURLHive
- Hive的基本操作用法Hive