DB2 抽樣統計案例
我們的資料庫中有一張表資料量超過30億(當時是v9.1版本),有一天我們需要對該表建一個索引,
建完之後需要做runstats,一開始並沒有考慮太多,結果跑了20多分鐘,runstats命令報錯了,說臨時表空間滿了,
一檢查發現我們資料庫的臨時表空間只有280G,全表runstats根本沒法做。當時很苦惱,自己想了很長時間也沒轍,
後來就請教了DB2培訓及技術交流群中的大拿“大風”老師,他給我一個方法,
採用樣本收集,即快捷且統計資訊準確率又高。他給了兩種樣本統計方式:
runstats on table myschema.customer with distribution on all columns
and detailed indexes all tablesample system (10); ----- 10 percent of the pages
runstats on table myschema.customer on all columns
and sample detailed indexes all tablesample bernoulli (15); ------ 15 percent of all rows
兩種 sampling 的區別在於
For BERNOULLI, all data pages will be retrieved through a table scan
but only the percentage of rows as specified through the numeric-literal parameter will be used for the statistics collection.
For SYSTEM, only a percentage of the data pages as specified through the numeric-literal parameter will be retrieved
and used for the statistics collection.
建完之後需要做runstats,一開始並沒有考慮太多,結果跑了20多分鐘,runstats命令報錯了,說臨時表空間滿了,
一檢查發現我們資料庫的臨時表空間只有280G,全表runstats根本沒法做。當時很苦惱,自己想了很長時間也沒轍,
後來就請教了DB2培訓及技術交流群中的大拿“大風”老師,他給我一個方法,
採用樣本收集,即快捷且統計資訊準確率又高。他給了兩種樣本統計方式:
runstats on table myschema.customer with distribution on all columns
and detailed indexes all tablesample system (10); ----- 10 percent of the pages
runstats on table myschema.customer on all columns
and sample detailed indexes all tablesample bernoulli (15); ------ 15 percent of all rows
兩種 sampling 的區別在於
For BERNOULLI, all data pages will be retrieved through a table scan
but only the percentage of rows as specified through the numeric-literal parameter will be used for the statistics collection.
For SYSTEM, only a percentage of the data pages as specified through the numeric-literal parameter will be retrieved
and used for the statistics collection.
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22661144/viewspace-1477205/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- ORACLE統計抽樣預設比例Oracle
- 12 random案例 年會抽獎案例random
- 多元統計分析04:多元正態分佈的抽樣分佈
- 水庫抽樣演算法演算法
- 使用Hive隨機抽樣Hive隨機
- db2大表統計DB2
- numpy2.隨機抽樣隨機
- C# 蓄水池抽樣C#
- 抽樣之逆轉換方法
- [Hive]Hive實現抽樣查詢Hive
- 資料探勘與資料抽樣
- 活動抽獎元件設計元件
- 聊聊抽卡這件事——從系統與使用者行為資料全面分析抽卡設計
- MCMC 、抽樣演算法與軟體實現演算法
- 蓄水池抽樣及Google搜尋之星分析Go
- 大轉盤抽獎系統
- 抽獎系統細節玩法
- DB2 統計資訊與重組相關操作DB2
- 用Excel做資料說明――抽樣說明工具Excel
- 如何設計一個百萬級使用者的抽獎系統?
- 拼團抽獎系統模式玩法模式
- 抽絲剝繭——代理設計模式設計模式
- 使用DataPump的Sample引數來進行資料抽樣
- 抽卡體驗設計:關於盲盒、抽卡、開箱的一切
- 盲盒商城系統開發抽獎系統方案
- 【小型系統】抽獎系統-使用Java Swing完成Java
- 抽獎小程式資料庫設計資料庫
- 概率計算(抽獎活動、命中率)
- 分散式抽獎秒殺系統,DDD架構設計和實現分享分散式架構
- db2 執行計劃DB2
- Oracle資料庫使用空間統計案例Oracle資料庫
- 線上抽獎系統的測試報告測試報告
- [案例] 字元型欄位統計資訊只對前32位進行統計字元
- 遊戲商業化設計思考(一)--抽獎遊戲
- 抽絲剝繭——備忘錄設計模式設計模式
- 隨機抽樣一致性(RANSAC)演算法詳解隨機演算法
- LeetCode 398 Random Pick Index(蓄水池抽樣典型例題)LeetCoderandomIndex
- 統計02:怎樣描繪資料