這個大表走索引欄位查詢的 SQL 怎麼就成全掃描了，我TM人傻了

乾貨滿滿張雜湊發表於2021-08-07

原文網址 : https://www.cnblogs.com/zhxdick/p/15111428.html

今天收到運營同學的一個 SQL，有點複雜，尤其是這個 SQL explain 都很長時間執行不出來，於是我們後臺團隊幫忙解決這個 SQL 問題，卻正好發現了一個隱藏很深的線上問題。

select 
a.share_code,
a.generated_time,
a.share_user_id,
b.user_count,
b.order_count,
a.share_order_id,
b.rewarded_amount
from t_risk_share_code a,
(select count(distinct r.user_id) user_count,
count(distinct r.order_id) order_count,
s.rewarded_amount,
r.share_code
from t_order s,t_order_rel r
where r.order_id = s.id and r.type = 1 and r.share_code = '我剛剛分享的訂單編碼'
group by r.share_code) b
where a.share_code = b.share_code and a.type = 1

首先，我們發現，直接 EXPLAIN 這個 SQL 也很慢，也就是可能某些子查詢被實際執行了導致。所以，第一步我們先將其中的子查詢拆解出來，逐步分析，即：

select count(distinct r.user_id) user_count,
count(distinct r.order_id) order_count,
max(s.rewarded_amount),
r.share_code
from t_order s,t_order_rel r
where r.order_id = s.id and r.type = 1 and r.share_code = '我剛剛分享的訂單編碼'
group by r.share_code

EXPLAIN 這個 SQL，執行很快，我們發現結果是：

奇了怪了，怎麼 t_order 這張表的掃描就成為全掃描了？這張表的索引是正常的呀，主鍵就是 id。

根據官方文件，可以知道有如下幾個原因

表太小了，走索引不值當的。但我們這裡這兩張表都非常大，都是千萬級別的資料。
對於 WHERE 或者 ON 的條件，沒有合適的索引，這也不是我們這裡的情況，兩張表都針對 WHERE 和 ON 條件有合適的索引（這裡查詢條件雖然都放到了 WHERE 裡面，但是後面的分析我們會知道這個 SQL 會被改成 JOIN ON + WHERE 去執行）。
使用索引列與常數值作比較， MYSQL 通過索引分析出這個覆蓋了表中大部分的值，其實就是分析出命中的行最後回表拉取資料的時候，表的檔案中大部分頁都要被載入到記憶體中進行讀取，這樣的話與其說先將索引載入到記憶體中獲取命中列，不如直接掃描整個表，反正最後也是差不多將表的檔案中大部分頁都載入到記憶體中。這種情況很顯然，不走索引反而會更快。我們這個 SQL 中，t_order_rel 表實際上根據 where 條件只會返回幾十條資料，t_order 與 t_order_rel 是 1 對多的關係，這裡不會命中太多資料的。
這一列值的離散度（Cardinality）太低，離散度就是是不同值的個數除以行數，最大為 1。但是這個值對於 innoDB 引擎來說，並不是實時計算的，可能不準確（尤其是在這一列的值發生更新導致行在頁中的位置發生變化的時候）.但是對於 distinct 或者主鍵列是不用計算的，就是 1。如果離散度太低，那麼其實和第三種情況差不多，會命中過多的行數。這裡我們要優化的 SQL 使用的是主鍵，所以不屬於這種情況。

雖然以上都不是我們這裡要討論的情況，但是這裡還是提一些我們為了避免出現全掃描的優化：

為了讓 SQL 執行計劃分析器更準確，針對第四種情況，我們對於某些表可能需要在業務閒時定期執行 ANALYZE TABLE，來確保分析器的統計資料的準確性。
由於考慮分庫分表，以及有時候資料庫 SQL 執行計劃總是不完美還是會出現索引走錯的情況，我們一般儘量在 OLTP 查詢業務上加 force index 強制走一些索引。這在使用基於中介軟體的分庫分表（例如 sharding-jdbc）或者原生分散式資料庫（例如 TiDB）過程中，我們經常遇到的坑。
對於 MySQL，我們設定 --max-seeks-for-key = 10000（預設這個值非常大），這樣其實就是限制了每次 SQL 執行計劃分析器分析出來的走索引可能掃描的行數。其原理非常簡單，參考原始碼：

sql_planner.cc

double find_cost_for_ref(const THD *thd, TABLE *table, unsigned keyno,
                         double num_rows, double worst_seeks) {
  //將分析出會掃描的行數與 max_seeks_for_key 作對比，取其中小的那個
  //也就是 SQL 分析器得出的結論中，走索引掃描的行數不會超過 max_seeks_for_key
  num_rows = std::min(num_rows, double(thd->variables.max_seeks_for_key));
  if (table->covering_keys.is_set(keyno)) {
    // We can use only index tree
    const Cost_estimate index_read_cost =
        table->file->index_scan_cost(keyno, 1, num_rows);
    return index_read_cost.total_cost();
  } else if (keyno == table->s->primary_key &&
             table->file->primary_key_is_clustered()) {
    const Cost_estimate table_read_cost =
        table->file->read_cost(keyno, 1, num_rows);
    return table_read_cost.total_cost();
  } else
    return min(table->cost_model()->page_read_cost(num_rows), worst_seeks);
}

這個不能設定太小，否則會出現可以走多個索引但是走到實際掃描行數最多的索引。

現在沒辦法了，EXPLAIN 已經不夠我們分析出問題了，只能進一步求助 optimizer_trace 了。不直接用 optimizer_trace 的原因是，optimizer_trace 必須完整的執行 SQL 之後，才能獲取到所有有用的資訊。

## 開啟 optimizer_trace
set session optimizer_trace="enabled=on";
## 執行 SQL
select .....
## 查詢 trace 結果
SELECT trace FROM information_schema.OPTIMIZER_TRACE;

通過 trace 結果我們發現，實際執行的 SQL 是：

SELECT
	各種欄位
FROM
	`t_order_rel` `r`
	JOIN `t_order` `s` 
WHERE
	(
	( `r`.`order_id` = CONVERT ( `s`.`id` USING utf8mb4 ) ) 
	AND ( `r`.`type` = 1 ) 
	AND ( `r`.`share_code` = 'B2MTB6C' ) 
	)

我去，原來兩個表的欄位的編碼是不一樣的！導致 JOIN ON 的時候，套了一層編碼轉換 CONVERT ( s.idUSING utf8mb4 ) ).我們知道，欄位外套一層函式這種條件匹配，是走不到索引的，例如：date(create_time) < "2021-8-1" 是不能走索引的，但是 create_time < "2021-8-1" 是可以的。不同型別之間列的比較，也走不到索引，因為 MySQL 會自動套上型別轉換函式。這也是 MySQL 的語法糖經常帶來的誤用。

這個 t_order_rel 的預設編碼和其他表不一樣，由於某些欄位使用了 emoji 表情，所以建表的時候整個表預設編碼使用了 utf8mb4。而且這個表僅僅是記錄使用，沒有 OLTP 的業務，只有一些運營同學使用的 OLAP 場景。所以一直沒有發現這個問題。

修改欄位編碼後，SQL 終於不是全掃描了。同時以後要注意：

資料庫指定預設的編碼，表不再指定預設編碼，同時對於需要使用特殊編碼的欄位，針對欄位指定編碼
join，where 的時候，注意 compare 兩邊的型別是否一致，是否會導致不走索引

微信搜尋“我的程式設計喵”關注公眾號，每日一刷，輕鬆提升技術，斬獲各種offer：

我就想加個索引，怎麼就這麼難？
2020-08-07
索引
SQL Server 查詢表註釋和欄位
2020-12-07
SQLServer
Sql查詢一個表中某欄位的資料在另一個表中某欄位中不存在的
2024-03-12
SQL
mysql sql同一個欄位多個行轉成一個欄位查詢
2024-09-07
MySql
SQL 如何查詢每個分組都出現的欄位值
2020-06-18
SQL
同一張表的兩個欄位比較查詢
2021-04-25
獲取異常資訊裡再出異常就找不到日誌了，我TM人傻了
2021-08-11
sql根據多個欄位查詢重複記錄
2021-09-18
SQL
JVM 輸出 GC 日誌導致 JVM 卡住，我 TM 人傻了
2022-06-17
JVMGC
Spring Cloud Gateway 沒有鏈路資訊，我 TM 人傻了（上）
2021-09-24
SpringCloudGateway
在 with 查詢中只查詢個別欄位
2018-09-19
查詢資料庫表及表欄位
2024-12-05
資料庫
Spark SQL解析查詢parquet格式Hive表獲取分割槽欄位和查詢條件
2020-12-03
SparkSQLHive
[20180408]那些函式索引適合欄位的查詢.txt
2018-04-08
函式索引
怎麼給字串欄位加索引？
2022-03-05
字串索引
Laravel 對於 Mysql 欄位string型別查詢，當使用數字對這個欄位進行查詢，PHP弱型別語言導致索引失效
2021-07-22
LaravelMySql型別PHP索引
Native for sql 查詢列欄位非命令列形式
2018-03-21
SQL命令列
揭秘PostgreSQL：如何查詢表欄位名稱
2024-06-03
SQL
Spring Cloud Gateway 不小心換了個 Web 容器就不能用了，我 TM 人傻了
2022-03-12
SpringCloudGatewayWeb
如何查詢某個資料表中除某個欄位的所有資訊？？？
2021-03-22
SQL 兩個表組合查詢
2024-03-06
SQL
mysql基礎依據一個欄位查詢另外一個欄位存在不同的值
2018-05-21
MySql
查詢/刪除重複的資料(單個欄位和多個欄位條件)
2020-11-21
SQL Server索引查詢/掃描沒有出現key lookup的案例淺析
2024-03-14
SQLServer索引
mySql刪除多個表刪除多個欄位的SQL
2024-06-13
MySql
AppBoxFuture: 二級索引及索引掃描查詢資料
2019-07-24
APP索引
升級到Spring 5.3.x之後，GC次數急劇增加，我TM人傻了
2021-08-06
SpringGC
關於建表欄位是否該使用not null這個問題你怎麼看?
2024-09-25
Null
MySQL查詢某個欄位含有字母數字的值
2024-05-24
MySql
億級大表線上不鎖表變更欄位與索引
2021-01-18
索引
技術分享 | 為什麼 SELECT 查詢選擇全表掃描，而不走索引？
2021-10-12
索引
Elasticsearch 複合查詢——多字串多欄位查詢
2021-03-14
Elasticsearch字串
查詢mysql某張表中的所有資料（欄位）型別
2018-05-31
MySql型別
MySql 查詢某一天日期格式欄位走索引問題
2024-03-28
MySql索引
多表關聯查詢中，關聯欄位都應該建立索引嗎？
2021-03-25
索引
MySQL如何查詢某個欄位含有字母數字的值
2024-05-26
MySql
ArcGIS對欄位分割查詢操作
2020-10-19
查詢oracle欄位預設值
2024-08-21
Oracle

這個大表走索引欄位查詢的 SQL 怎麼就成全掃描了，我TM人傻了

相關文章