[Hive]hive分割槽設定注意事項
1、分割槽不宜過多
建立分割槽可以讓Hive不必對輸入進行全盤掃描,確實可以優化查詢。但是使用過多分割槽會帶來兩方面的問題:
(1)HDFS設計用於儲存數百萬的大檔案,而不是數十億的小檔案。使用過多分割槽會建立大量的非必須的hadoop檔案和資料夾。一個分割槽對應一個包含多個檔案的資料夾。如果指定的表存在數百個分割槽,則可能每天都會建立好幾萬個檔案。
(2)MapReduce會將一個任務(job)轉化成多個任務(task)。預設情況下每個task都是一個JVM例項,都需要開啟和銷燬。對於小檔案,每個檔案都會對應一個task。在一些情況下,JVM開啟和銷燬的時間可能會比實際處理資料的時間要長。
2、理想的分割槽方案不應該產生太多的分割槽和資料夾目錄,並且每個目錄下的檔案應該足夠大,應該是檔案系統中塊的若干倍。
3、如果使用者不能夠找到好的、大小相對合適的分割槽方式的話,那麼可以考慮使用分桶儲存
相關文章
- HIVE基本語法以及HIVE分割槽Hive
- Hive動態分割槽Hive
- hive查詢注意事項和調優Hive
- Hive和Spark分割槽策略HiveSpark
- Spark操作Hive分割槽表SparkHive
- Hive的分割槽和排序Hive排序
- Hive的靜態分割槽與動態分割槽Hive
- Hive動態分割槽詳解Hive
- 一起學Hive——使用MSCK命令修復Hive分割槽Hive
- SQL Server 表分割槽注意事項HXSQLServer
- SD卡分割槽時需要注意什麼?SD卡分割槽注意事項SD卡
- 非分割槽錶轉換成分割槽表以及注意事項
- Hive中靜態分割槽和動態分割槽總結Hive
- 電腦硬碟分割槽要注意什麼,刪除硬碟分割槽的注意事項硬碟
- hive 動態分割槽插入資料表Hive
- hive分割槽和分桶你熟悉嗎?Hive
- hive Sql的動態分割槽問題HiveSQL
- hive迷案之消失的分割槽檔案Hive
- hive學習筆記之四:分割槽表Hive筆記
- hive 分割槽表和分桶表區別Hive
- ORACLE分割槽表梳理系列(二)- 分割槽表日常維護及注意事項Oracle
- 字串分割注意事項字串
- 非常詳細地Hive的基本操作和一些注意事項Hive
- 好程式設計師大資料培訓分享Hive的靜態分割槽與動態分割槽程式設計師大資料Hive
- hive中的表、外部表、分割槽和桶的理解Hive
- ORACLE分割槽表梳理系列(一)- 分割槽表概述、分類、使用方法及注意事項Oracle
- 好程式設計師大資料開發之掌握Hive的靜態分割槽與動態分割槽程式設計師大資料Hive
- 第39期:MySQL 時間類分割槽寫 SQL 注意事項MySql
- JavaScript 設定CSS與注意事項JavaScriptCSS
- SQL Server Profiler 設定注意事項SQLServer
- hive從入門到放棄(四)——分割槽與分桶Hive
- Hive優化相關設定Hive優化
- SSD固態硬碟是分割槽好還是不分割槽好?SSD固態硬碟使用注意事項硬碟
- Oracle:記憶體設定注意事項Oracle記憶體
- Hive學習筆記 3 Hive的資料模型:內部表、分割槽表、外部表、桶表、檢視Hive筆記模型
- Hive學習之四 《Hive分割槽表場景案例應用案例,企業日誌載入》 詳解Hive
- U盤啟動+硬碟分割槽+重灌Win10系統(注意事項)硬碟Win10
- HIVE隨手記——Hive命令(?$HIVE_HOME/bin/hive)Hive