傳說中的“謂詞越界“場景

bisal發表於2018-12-25

開發環境,碰見一個謂詞越界的問題,模擬這條SQL,如下所示,其中A_ID是表test的外來鍵,並且存在索引,

SELECT 1 FROM test WHERE A_ID = 6052138 AND IS_VALID = 1

這張表的資料量,大約10萬,

SQL> select count(*) from test;
 COUNT(*)
----------
    99044

檢視select 1這條SQL的10053,

***************************************
BASE STATISTICAL INFORMATION
***********************
Table Stats::
  Table: TEST  Alias: TEST
    #Rows: 265702  #Blks:  13157  AvgRowLen:  180.00  ChainCnt:  0.00
Index Stats::
  Index: IDX_TEST_01  Col#: 2
    LVLS: 2  #LB: 1777  #DK: 119696  LB/K: 1.00  DB/K: 1.00  CLUF: 118505.00
  Index: IDX_TEST_02  Col#: 3
    LVLS: 2  #LB: 2339  #DK: 381  LB/K: 6.00  DB/K: 272.00  CLUF: 103794.00
  Index: IDX_TEST_03  Col#: 7
    LVLS: 2  #LB: 786  #DK: 2292  LB/K: 1.00  DB/K: 36.00  CLUF: 82804.00
  Index: PK_TEST_ID  Col#: 1
    LVLS: 2  #LB: 1652  #DK: 265702  LB/K: 1.00  DB/K: 1.00  CLUF: 238444.00
Access path analysis for TEST
***************************************
SINGLE TABLE ACCESS PATH 
  Single Table Cardinality Estimation for TEST[TEST] 
  Column (#2): A_ID(
    AvgLen: 6 NDV: 119696 Nulls: 0 Density: 0.000008 Min: 5586857 Max: 5726449
  Column (#60): IS_VALID(
    AvgLen: 3 NDV: 1 Nulls: 0 Density: 0.000002 Min: 1 Max: 1
    Histogram: Freq  #Bkts: 1  UncompBkts: 10049  EndPtVals: 1
Using prorated density: 0.000002 of col #2 as selectvity of out-of-range/non-existent value pred
  Table: TEST  Alias: TEST
    Card: Original: 265702.000000  Rounded: 1  Computed: 0.50  Non Adjusted: 0.50
  Access Path: TableScan
    Cost:  3577.48  Resp: 3577.48  Degree: 0
      Cost_io: 3565.00  Cost_cpu: 460365831
      Resp_io: 3565.00  Resp_cpu: 460365831
  Using prorated density: 0.000002 of col #2 as selectvity of out-of-range/non-existent value pred
  Access Path: index (AllEqRange)
    Index: IDX_TEST_01
    resc_io: 4.00  resc_cpu: 30301
    ix_sel: 0.000002  ix_sel_with_filters: 0.000002 
    Cost: 4.00  Resp: 4.00  Degree: 1
  Best:: AccessPath: IndexRange
  Index: IDX_TEST_01
         Cost: 4.00  Degree: 1  Resp: 4.00  Card: 0.50  Bytes: 0
***************************************
...
CBRID: TEST @ SEL$1 TableLookup allocation - Failure - : disabled by parameter

看見提示,#2這列,即A_ID,對於超出範圍的、不存在的值,使用0.000002作為選擇率,即這種選擇率,是預估的值,不是實際計算的,換句話說,有可能對執行成本的計算,產生偏差,

Using prorated density: 0.000002 of col #2 as selectvity of out-of-range/non-existent value pred


我們從這張表,A_ID欄位實際的儲存,看下是否存在他所說的,“超出範圍”,

SQL> select min(A_ID), max(A_ID) from TEST;
MIN(A_ID) MAX(A_ID)
--------- ---------
  6006992   6052756

上述結果展示,A_ID的取值範圍是6006992-6052756,而trace中,標記A_ID的min和max則是5586857-5726449,因此,這條SQL,出現了傳說中的“謂詞越界”,

Min: 5586857 Max: 5726449


trace中的min和max,怎麼得來的?他是讀取的dba_tab_col_statistics檢視,通過換算得到的,

SQL> select table_name, column_name, utl_raw.cast_to_number(low_value) low,
  2  utl_raw.cast_to_number(high_value) hight
  3  from dba_tab_col_statistics
  4  WHERE table_name='TEST' AND column_name='A_ID'
  5  and owner='BISAL';
TABLE_NAME               COLUMN_NAME                      LOW      HIGHT
------------------------ ------------------------------ -------- -----------
TEST                     A_ID                            5586857   5726449


但是慶幸的是,雖然出現了謂詞越界的問題,並沒有因為成本值計算偏差,導致CBO選擇錯誤的執行計劃,我覺得和這條SQL的謂詞條件比較簡單,有一定的關係,可選擇的執行計劃就這兩種,

SELECT /*+gather_plan_statistics*/ 1 FROM test WHERE A_ID = 6052138 AND IS_VALID = 1
select * from table(dbms_xplan.display_cursor(null,null,'ALLSTATS LAST'));
Plan hash value: 1000423460
-----------------------------------------------------------------------------------------------------------------
| Id  | Operation                   | Name        | Starts | E-Rows | A-Rows |   A-Time   | Buffers |
-----------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT            |             |      1 |        |      2 |00:00:00.01 |       6 |
|*  1 |  TABLE ACCESS BY INDEX ROWID| TEST        |      1 |      1 |      2 |00:00:00.01 |       6 |
|*  2 |   INDEX RANGE SCAN          | IDX_TEST_01 |      1 |      1 |      2 |00:00:00.01 |       4 |
-----------------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
   1 - filter("IS_VALID"=1)
   2 - access("A_ID"=6052138)


因此這個案例中,雖然出現了“謂詞越界”,對COST的計算,會有誤差,但並未影響執行計劃的選擇,如果是一條謂詞複雜的SQL,包含多種執行計劃的可能,出現“謂詞越界”,選錯執行計劃,形成效能問題,就是大概率了。


解決方法,就是重採集統計資訊,以讓COST的計算,更接近實際,避免使用預設值,讓CBO作出正確選擇。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/7192724/viewspace-2286274/,如需轉載,請註明出處,否則將追究法律責任。

相關文章