MYSQL DQL in 到底會不會走索引&in 範圍查詢引發的思考。

[傾盡伊人]發表於2024-07-16

原文網址 : https://www.cnblogs.com/richicewoo/p/18304194

MySql索引

前情引子

in 會不會走索引？很多人肯定會回答、廢話、如果命中了索引、那肯定會走。

其實我和大多數人一樣、一開始也是這麼想的、直至有一個血淋淋的案子讓我有所改觀、有所思考。

背景介紹

業務的工單表、我們分了64張、以userId作為分表鍵、業務實際場景中未使用到搜尋引擎、主要是一些B端業務。

業務有一個場景是使用userId作為條件使用in語句查詢工單資料。

這裡分析一下、

第一個userId作為分表鍵作為查詢條件是合理的
第二個、該業務場景下的SQL為userId欄位新增了索引、是考慮到的

實際發生問題

該需求上線之後、我們發現個別B端使用人員、他需要查詢userId為5w左右的條件查詢、經日誌查詢該查詢的耗時大概在35S左右、正常查詢都是3S以內。當問題發生的時候、我就在分析、in 到底有沒有走索引、如下

5w/64張表=781 個假設按照平均分配每個表的in包含的個是不足1k
第二個每張分表其實都是新增了索引的
資料庫的監控服務沒有查詢到有慢SQL出現

綜合以上初步判斷、這麼小的量、如果命中索引、那不該需要查詢這麼長的時間。

解決方案

既然出現了問題、那肯定是要解決方案的、思考的角度如下：

分表情況下、無法使用大家熟悉的explain 語句直接查詢資料庫、讓資料庫告訴你有沒有使用索引、當然、如果你指定其中一張分表還是可以使用explain語句的
資料庫分表、DB的操作實際上是將每張表的查詢結果出來之後、全部load到記憶體聚合之後再返回給實際呼叫他的Java服務的
假設這裡命中了索引、基於第二點那慢的另一個因素可能就是DB伺服器記憶體被打滿了

這裡我基於第三點的假設、對於業務程式碼進行了改造

使用in條件進行查詢

限制了每次查詢資料庫in所包含的userId個數最多是5000個、即時就是我們經常說的批次查詢、這樣子做、最大量的5w就會分成10批去查詢資料庫、結果再聚合。而分到每張表的in包含的個數、按平均情況就只有了78個左右了、改成這種寫法、從宏觀的角度、就是把DB的一部分壓力轉移到業務伺服器上。

結果如何

新的程式碼拿到正式環境進行驗證之後、使用同樣的使用者進行測試、in的條件個數仍是5w、但最後的查詢結果僅在3S左右就返回了、完成了從35S到3S的質的飛躍的提升。

對於解決問題而言、我們已經是成功的Solver、We are white cat or black cat.

But 這裡有仍有兩個疑問、

批次的數量具體是哪個值合適2k or 5k、這裡我的5k值是與我的正常業務的水平相一致的、所以我說是適合我的、但並不是適合所有場景、所有人。

從最後的結果提升來看、我更傾向於改造後的程式碼既是走了索引、也為DB減少了壓力、才會有這麼高的效能提升。

我請教一位現世高人

索引的型別和質量：B-TREE、不需要回表查詢、完全命中。
in條件值的分佈：分佈均勻可能會使用到索引
成本估算：MYSQL的查詢最佳化器會基於統計資訊對不同的執行計劃進行成本估算？全表嫂 or 還是用索引比較合適呢？
系統配置和資源限制：innodb-buffer-pool-size？系統的資源使用情況都會影響執行計劃的選擇
資料庫的版本和配置：5.5及以上查詢最佳化器對in操作進行了最佳化、但仍舊不能保證。

MySQL 唯一索引範圍查詢鎖下一個記錄的理解
2022-09-22
MySql索引
mysql索引不會命中的情況
2021-09-09
MySql索引
MySQL（三）DQL之基礎查詢
2018-05-19
MySql
關於聯合索引，範圍查詢，時間列索引的幾個問題
2021-04-23
索引
MySql中的資料查詢語言（DQL）三：連線查詢
2020-12-17
MySql
MYSQL練習1: DQL查詢練習
2024-03-09
MySql
MySQL修改表結構到底會不會鎖表？
2021-12-21
MySql
mysql的唯一索引不會利用change buffer
2024-10-15
MySql索引
Oracle日期時間範圍查詢
2019-01-09
Oracle
【必知必會的MySQL知識】⑤DQL語言
2023-05-04
MySql
MYSQL學習筆記6: DQL條件查詢（where）
2024-03-08
MySql筆記
MYSQL學習筆記8: DQL分組查詢(group by)
2024-03-08
MySql筆記
一個查詢不走索引的例子
2018-06-26
索引
MySQL索引與查詢優化
2019-04-13
MySql索引優化
Javaweb-DQL-條件查詢
2024-09-07
JavaWeb
MYSQL學習筆記11: DQL查詢執行順序
2024-03-09
MySql筆記
記錄一下MySql update會鎖定哪些範圍的資料
2022-06-24
MySql
開發人員不得不會的MySQL多表聯合查詢方法！
2022-12-20
MySql
根據時間範圍呼叫gitLab介面查詢
2024-07-04
Gitlab
MySQL 覆蓋索引、回表查詢
2024-04-04
MySql索引
redis~有序集合處理ip範圍的查詢問題
2024-11-25
Redis
理解索引（中）：MySQL查詢過程和高階查詢
2018-05-29
索引MySql
資料庫查詢語言（DQL）
2024-11-13
資料庫
刨根問底: Kafka 到底會不會丟資料？
2022-01-15
Kafka
Excel 2010 SQL應用032 字元範圍的模糊匹配查詢
2020-12-16
ExcelSQL字元
MySQL 學習之索引篇和查詢
2020-10-27
MySql索引
MySQL 索引及查詢優化總結
2019-01-02
MySql索引優化
談談MYSQL索引是如何提高查詢效率的
2021-06-02
MySql索引
Mysql 會導致索引失效的情況
2021-12-08
MySql索引
MySQL欄位的取值範圍
2021-01-26
MySql
ChatGPT的使用範圍到底有多廣？
2024-06-28
ChatGPT
MySQL必知必會筆記——查詢的基礎知識
2021-06-11
MySql筆記
Python 的切片為什麼不會索引越界？
2021-12-20
Python索引
Oracle阻塞會話查詢
2018-05-10
Oracle會話
開發人員不得不知的MySQL索引和查詢優化
2019-03-27
MySql索引優化
MySQL索引原理及慢查詢最佳化
2020-09-20
MySql索引
Mysql建表、索引、函式、查詢使用中的坑！！！
2020-11-11
MySql索引函式
MySQL實驗: 實踐索引對全列匹配、最左字首匹配、範圍查詢等條件的影響以及瞭解髒讀、幻讀等
2018-10-14
MySql索引