什麼是Hive?它有哪些特點和特性?

千鋒武漢發表於2021-07-01

  Hive是建立在Hadoop檔案系統上的資料倉儲,它提供了一系列工具,能夠對儲存在HDFS中的資料進行資料提取、轉換和載入(ETL),這是一種可以儲存、查詢和分析儲存在Hadoop中的大規模資料的工具。

  Hive定義了簡單的類SQL查詢語言,稱為HQL,它可以將結構化的資料檔案對映為一張資料表,允許熟悉 SQL 的使用者查詢資料,也允許熟悉 MapReduce 的開發者開發自定義的 mapper和 reducer來處理內建的 mapper 和 reducer 無法完成的複雜的分析工作,相對於Java程式碼編寫的MapReduce來說,Hive的優勢更加明顯。

  由於Hive採用了SQL的查詢語言HQL,因此很容易將Hive理解為資料庫。其實從結構上來看,Hive和資料庫除了擁有類似的查詢語言,再無類似之處。接下來,我們以傳統資料庫MySQL和Hive的對比為例,透過他們的對比來幫助大家理解Hive的特性,具體如表1所示。

表1 Hive與傳統資料庫對比

1

  什麼是Hive?它有哪些特點和特性?透過上面的詳細介紹,同學們都瞭解了嗎?如果還想了解更多這方面的知識和相關資料,可以關注小千,後期分享更多Python知識。

  本文來自千鋒教育,轉載請註明出處。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31548651/viewspace-2779217/,如需轉載,請註明出處,否則將追究法律責任。

相關文章