Hive partition prune的一個Bug
昨天跑了一個Hive查詢發現啟動的MAP數遠遠多於預期,很奇怪;查詢可以簡單抽象如下:
比如有一個表t的分割槽鍵dt string;查詢select count(*) from t where dt=20130926;
是哪裡出了問題呢?首先看一下執行計劃果然發現問題了:
首先出現了:
expr: (dt = 2.0130926E7)
type: boolean
其次partition values是dt 和__HIVE_DEFAULT_PARTITION__
應該發生了類似隱式轉換的事情吧?修改成dt=’20130926’再看正確了.
因為隱式轉換而無法使用索引的情況在RDBMS比較常見,但是這個如果是隱式轉換也說不通,因為只是多掃描了一個分割槽而不是全部分割槽,帶著這樣的疑問看原始碼:得到的結論就是Hive的分割槽鍵列和值都必須是String型別,如果不是就可能會Hit到bug 4878(pruneBySequentialScan),不知道為什麼CDH4.2沒有merge這個patch.
Update:這個Bug已經在Hive 0.12被fixed掉了
本文轉自MIKE老畢 51CTO部落格,原文連結:http://blog.51cto.com/boylook/1302073,如需轉載請自行聯絡原作者
相關文章
- hive partitionHive
- hive dynamic partition的使用Hive
- hive中partition如何使用Hive
- Hive的一個面試題Hive面試題
- 巧妙使用exchange partition的一個案例
- oracle的一個bugOracle
- mysql partition table use to_days bugMySql
- Hive常見的bug與解決辦法。Hive
- hive-3.0.0 版本中遇到的bug 彙總Hive
- 一個排序引發的BUG排序
- 一個關於recyclerView的bugView
- Android assets的一個bugAndroid
- 關於UIInterfaceOrientation的一個bugUI
- 圖靈社群的一個BUG圖靈
- oracle 10.2.0.2.0的一個BUGOracle
- 一個bug造就的經典遊戲....遊戲
- 發現Mapstruct的一個bugStruct
- Oracle關於nvl的一個BugOracle
- FluentData Mysql分頁的一個BUGMySql
- 一個oracle查詢引起的bugOracle
- 今天遇到一個VERITAS NBU的BUG
- [BUG反饋]AdminController類的一個小bugController
- 記一個RxJava使用bugRxJava
- NDK clang編譯器的一個bug編譯
- onethink安裝時的一個bug
- java log4j 的一個bugJava
- 找到Intel手冊裡的一個bugIntel
- 一個oracle bug的簡單驗證Oracle
- 【Hive一】Hive安裝及配置Hive
- oracle分割槽partition及分割槽索引partition index(一)Oracle索引Index
- DB2 prune 與 list historyDB2
- hive學習之一:認識hiveHive
- split partition的一些測試
- exchange partition的一些測試
- Hive學習之一 《Hive的介紹和安裝》Hive
- SpringBoot讀取yml的一個bugSpring Boot
- 10g sqlplus的一個bugSQL
- 這不會又是一個Go的BUG吧?Go