[Hive]Hive實現抽樣查詢

TOMOCAT發表於2018-08-16

原文網址 : https://blog.csdn.net/tomocat/article/details/81706810

對於非常大的資料集，有時使用者需要使用的知識一個具有代表性的查詢結果，而不是全部結果。Hive可以通過對錶進行分桶抽樣來滿足這個需求。

1、分桶抽樣查詢

select * from numbers TABLESAMPLE(BUCKET 3 OUT OF 10 ON number) s;

其中tablesample是抽樣語句，語法：TABLESAMPLE(BUCKET x OUT OF y) 。y必須是table總bucket數的倍數或者因子。hive根據y的大小，決定抽樣的比例。例如，table總共分了64份，當y=32時，抽取(64/32=)2個bucket的資料，當y=128時，抽取(64/128=)1/2個bucket的資料。x表示從哪個bucket開始抽取。例如，table總bucket數為32，tablesample(bucket 3 out of 16)，表示總共抽取（32/16=）2個bucket的資料，分別為第3個bucket和第（3+16=）19個bucket的資料。

2、資料塊抽樣

Hive提供了另外一種按照抽樣百分比進行抽樣的方式，這種是基於行數的，按照輸入路徑下的資料塊百分比進行抽樣。

select * from numbersflat TABLESAMPLE(0.1 PERCENT) s；

這種抽樣方式不一定適用於所有的檔案格式。另外抽樣的最小抽樣單元是一個HDFS資料塊。如果標的資料大小小於普通的塊大小128MB，那麼會返回所有的行。

Hive -------- hive常見查詢練習
2018-11-13
Hive
[Hive]Hive中表連線的優化，加快查詢速度
2018-08-15
Hive優化
Hive高階操作-查詢操作
2024-06-28
Hive
hive查詢注意事項和調優
2018-09-21
Hive
hive表查詢中文顯示亂碼
2018-06-04
Hive
flink實戰--讀寫Hive（Flink on Hive）
2019-08-28
Hive
Hive內部函式簡介及查詢語法
2018-07-02
Hive函式
使用Presto查詢hive表資料時報"Error opening Hive split hdfs"問題，及解決方法
2018-11-14
RESTHiveError
Hive --------- hive 的優化
2018-11-12
Hive優化
[Hive]Hive排序優化
2018-08-15
Hive排序優化
【Hive】hive資料遷移
2018-08-21
Hive
Spark SQL解析查詢parquet格式Hive表獲取分割槽欄位和查詢條件
2020-12-03
SparkSQLHive
HIVE
2022-06-19
Hive
Hive調優實用
2020-11-29
Hive
【Hive一】Hive安裝及配置
2018-05-06
Hive
Flume和Hive整合之hive sink
2020-12-19
Hive
報表連 hive，資料量比較大，怎麼分頁查詢？
2020-06-23
Hive
hive將查詢資料插入表中某欄位無資料
2020-10-25
Hive
Hive學習之Hive的安裝
2018-11-30
Hive
HIVE基本語法以及HIVE分割槽
2018-09-20
Hive
hive匯出到csv hive匯出到excel
2020-11-19
HiveExcel
Hadoop實戰：Hive操作使用
2019-01-14
HadoopHive
圖解大資料 | 海量資料庫查詢-Hive與HBase詳解
2022-03-08
圖解大資料資料庫Hive
spark with hive
2018-11-21
SparkHive
[hive]hive資料模型中四種表
2018-08-14
Hive模型
[Hive]hive分割槽設定注意事項
2018-08-16
Hive
Hive效能調優實踐 - Vidhya
2022-02-20
Hive
【大資料開發】Hive——Hive函式大全
2020-11-06
大資料Hive函式
Hive 如何方便地實現儲存過程？
2020-05-21
Hive儲存過程
hive on spark配置
2018-12-01
HiveSpark
Hive學習
2019-04-14
Hive
Hive 入門
2018-12-12
Hive
Hive建立索引
2018-11-28
Hive索引
hive 報錯
2018-08-27
Hive
初識HIVE
2018-07-17
Hive
Hive 常用操作
2018-08-20
Hive
HBase vs Hive
2018-06-09
Hive
Hive shell 命令
2019-09-19
Hive

[Hive]Hive實現抽樣查詢

相關文章