SQL調優--表統計資訊未及時更新導致查詢超級慢

發表於2016-09-12

SQL

某日同事丟給我一個看上去複雜的查詢（實際就涉及兩張表，套來套去）說只是換了日期條件，但一個查詢5秒出資料，一個根本查不出來。現在整理下解決過程，及涉及的知識點。

若有不正之處，請多多諒解並歡迎批評指正，不甚感激。

一.問題描述

環境：sqlserver 2008r2

現象：

查詢涉及到兩張表

ODS_TABLE_A 每日資料700萬現在總計60多億。已建立索引+分割槽

MID_TABLE_B 每日資料20萬總計3000萬。已建立索引未分割槽

當etldate為 ‘2016-08-12’ 及以前的時間時，本查詢5秒出資料，

當etldate為 ‘2016-08-16’ 及以後的時間時，本查詢出不來資料。

貼上問題sql：做過資料欄位處理，針對本篇主題注意點放在查詢因為日期的選擇不同導致查詢時間變的超級慢，而不是改變sql寫法比如用臨時表，強制索引上。

———-《程式碼開始》

select 

COUNT(distinct(case when COL_USERID3 is null then COL_USERID6 end)) as 'aa',

COUNT(distinct(case when COL_USERID3 is null and COL_USERID7 is not null then COL_USERID6 end)) as 'bb',

COUNT(distinct(case when COL_USERID3 is not null then COL_USERID6 end)) as 'cc',

COUNT(distinct(case when COL_USERID3 is not null and COL_USERID7 is not null then COL_USERID6 end)) as 'dd',

SUM(case when COL_USERID3 IS not null then ee end) as 'ee'

from

(

    select c.COL_USERID3,c.ee,g.COL_USERID6

    from

    (

        select  b.COL_USERID2 as COL_USERID3,COUNT(b.COL_USERID2) as ee

        from

        (

            select COL_USERID as COL_USERID1,min(EventTime) as time1

                from ODS_TABLE_A    

                where  EtlDate = '2016-08-12'

                    and colid LIKE 'heihei%'

                    group by COL_USERID
 
        )as a
         join
        (
            select COL_USERID as COL_USERID2,eventtime as time2

                from ODS_TABLE_A  

                where EtlDate = '2016-08-12'

                    and ItemId = '1111111111101'

                    and colid like 'haha-%'

                    and colid not like 'haha-skill%'

                    and colid not like 'haha-fine%'

        )as b 

        on a.COL_USERID1 = b.COL_USERID2 and  a.time1 > b.time2

        group by b.COL_USERID2

    )as c
    right join
    (

        select  DISTINCT d.COL_USERID4 as COL_USERID6

        from

        (        
            select distinct COL_USERID as COL_USERID4

            from MID_TABLE_B     

            where etldate = '2016-08-12' 

        )as d

        join

        (
            select COL_USERID AS COL_USERID5

            from ODS_TABLE_A  

            where  EtlDate = '2016-08-12'

                and colid LIKE 'heihei%'

        )as f 

        on d.COL_USERID4 = f.COL_USERID5

    )as g

    on c.COL_USERID3 = g.COL_USERID6

)as i

left join
(
    select COL_USERID as COL_USERID7

    from MID_TABLE_B

    where EtlDate = '2016-08-12' 

        and IsTodayPay = '1'

)as h

on i.COL_USERID6 = h.COL_USERID7

100

101

102

103

104

105

106

107

108

109

110

111

112

select

COUNT(distinct(case when COL_USERID3 is null then COL_USERID6 end)) as 'aa',

COUNT(distinct(case when COL_USERID3 is null and COL_USERID7 is not null then COL_USERID6 end)) as 'bb',

COUNT(distinct(case when COL_USERID3 is not null then COL_USERID6 end)) as 'cc',

COUNT(distinct(case when COL_USERID3 is not null and COL_USERID7 is not null then COL_USERID6 end)) as 'dd',

SUM(case when COL_USERID3 IS not null then ee end) as 'ee'

from

(

select c.COL_USERID3,c.ee,g.COL_USERID6

from

(

select b.COL_USERID2 as COL_USERID3,COUNT(b.COL_USERID2) as ee

from

(

select COL_USERID as COL_USERID1,min(EventTime) as time1

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and colid LIKE 'heihei%'

group by COL_USERID

)as a

join

(

select COL_USERID as COL_USERID2,eventtime as time2

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and ItemId = '1111111111101'

and colid like 'haha-%'

and colid not like 'haha-skill%'

and colid not like 'haha-fine%'

)as b

on a.COL_USERID1 = b.COL_USERID2 and a.time1 > b.time2

group by b.COL_USERID2

)as c

right join

(

select DISTINCT d.COL_USERID4 as COL_USERID6

from

(

select distinct COL_USERID as COL_USERID4

from MID_TABLE_B

where etldate = '2016-08-12'

)as d

join

(

select COL_USERID AS COL_USERID5

from ODS_TABLE_A

where EtlDate = '2016-08-12'

and colid LIKE 'heihei%'

)as f

on d.COL_USERID4 = f.COL_USERID5

)as g

on c.COL_USERID3 = g.COL_USERID6

)as i

left join

(

select COL_USERID as COL_USERID7

from MID_TABLE_B

where EtlDate = '2016-08-12'

and IsTodayPay = '1'

)as h

on i.COL_USERID6 = h.COL_USERID7

———-《程式碼結束》

二。解決過程

1.先看了下上述程式碼的執行計劃如下圖初看上去需要用索引的地方都用到了。應該沒啥大問題。

可能你注意到系統提示的缺少索引資訊，加上去一樣效果，不能解決‘2016-08-16’ 查詢慢的問題。

2.在修改下日期，就是把【所有】 etldate=‘2016-08-12’ 的改成 etldate=‘2016-08-16’

看下執行計劃：對不起跑了半個小時沒出來，檢視估計的執行執行和上面的圖類似。
減少涉及到資料集的量加top 1 我再看執行計劃：
不貼圖了結果就是比上面的圖少了個【並行度】

初步以為是優化器因為估計行數等不準的原因沒選擇並行度，趕緊找程式碼讓它強行這樣走。
找到一篇宋大師的：強制SQL Server執行計劃使用並行提升在複雜查詢語句下的效能
http://www.cnblogs.com/CareySon/p/3851113.html

二話不說加關鍵字OPTION(querytraceon 8649)，可是應用到實際發現查詢效率無任何改善，久久不出結果。後來問宋大師（感謝宋大神）。他說有些操作是沒法並行的，更新統計資訊試試先。

執行如下程式碼：
update STATISTICS ODS_TABLE_A –（把ODS_TABLE_A 這個大表統計資訊更新）

預設情況下，查詢優化器已根據需要更新統計資訊以改進查詢計劃；但在某些情況下，你可以通過使用 UPDATE STATISTICS 或儲存過程 sp_updatestats 來比預設更新更頻繁地更新統計資訊，提高查詢效能。針對文中此種情況新插入的資料沒統計資訊，大表自動更新統計資訊觸發自動更新機制頻率不夠，最好定期更新。

關於update STATISTICS 就不累述了：給出相關技術貼連線
更新統計相關知識點傳送門：https://msdn.microsoft.com/zh-cn/library/ms187348.aspx
至此問題解決。

三、總結

對於大表新插入的資料沒及時更新統計資訊，導致出現上面文中的現象，一個日期導致查詢效率天壤之別的分水嶺（查12號前5秒出資料，查12號後死活不出來。）

解決辦法是大表自動更新統計資訊觸發自動更新機制頻率不夠，定期更新。

慢查詢分析調優工具～mysqldumpslow
2019-12-31
MySql
慢查詢分析調優工具～show profile
2020-01-02
[20181130]hash衝突導致查詢緩慢.txt
2018-11-30
mysql 表資料量大量查詢慢如何優化
2021-03-08
MySql優化
MySQL:RR模式下insert也可能導致查詢慢
2021-02-16
MySql模式
SQL Server 更新統計資訊
2024-05-24
SQLServer
Sql語句本身的優化-定位慢查詢
2018-10-11
SQL優化
SQL慢查詢排查思路
2021-07-27
SQL
HighgoDB查詢慢SQL和阻塞SQL
2021-12-20
GoSQL
微課sql最佳化(8)、統計資訊收集(6)-統計資訊查詢
2020-03-03
SQL
Microsoft SQL Server 2005中查詢優化器使用的統計資訊二(zt)
2019-03-02
ROSSQLServer優化
Microsoft SQL Server 2005中查詢優化器使用的統計資訊一(zt)
2019-07-07
ROSSQLServer優化
Microsoft SQL Server 2005中查詢優化器使用的統計資訊三(zt)
2019-06-07
ROSSQLServer優化
TiDB 查詢優化及調優系列（三）慢查詢診斷監控及排查
2022-05-06
TiDB優化
《MySQL慢查詢優化》之SQL語句及索引優化
2020-12-06
MySql優化索引
MySQL 慢查詢優化
2019-06-23
MySql優化
SQL Server 查詢超時問題排查
2024-05-22
SQLServer
執行SQL查詢導致磁碟耗盡故障演示
2018-06-04
SQL
ORACLE analyse table方式收集表統計資訊導致SQL執行計劃不準確而效能下降
2018-10-31
OracleSQL
快速學會慢查詢SQL排查
2022-12-08
SQL
sql查詢更新update select
2020-12-27
SQL
如何調優 Oracle SQL系列文章：查詢優化器介紹
2019-08-21
OracleSQL優化
記一次，因表變數導致SQL執行效率變慢
2021-11-06
變數SQL
mysql查詢效率慢的SQL語句
2018-12-12
MySql
SQL Server查詢慢的解決方案
2022-09-02
SQLServer
TiDB 查詢優化及調優系列（二）TiDB 查詢計劃簡介
2022-04-27
TiDB優化
TiDB 查詢優化及調優系列（四）查詢執行計劃的調整及優化原理
2022-05-24
TiDB優化
Mysql 慢查詢優化實踐
2019-01-29
MySql優化
優化sql查詢速度
2020-10-25
優化SQL
pageHelper分頁外掛導致的查詢慢的問題最佳化
2024-08-29
SQL優化之統計資訊和索引
2018-12-17
SQL優化索引
Oracle日常問題-臨時表過多導致exp速度慢
2020-02-17
Oracle
資料字典和固定表統計資訊更新
2023-01-10
在mysql查詢效率慢的SQL語句
2019-04-18
MySql
MySQL調優之查詢優化
2021-11-09
MySql優化
慢查詢
2024-08-20
【YashanDB知識庫】收集分割槽表統計資訊取樣率小於1導致SQL執行計劃走偏
2024-07-16
SQL
Oracle OCP(22)：查詢表資訊
2019-01-30
Oracle
mysql查詢表基礎資訊
2024-05-31
MySql

SQL調優--表統計資訊未及時更新導致查詢超級慢

一.問題描述

二。解決過程

三、總結

相關文章