資料庫索引融會貫通

兜裡有辣條發表於2019-02-16

原文網址 : https://juejin.im/post/5c67becf6fb9a049a42f9420

資料庫索引

索引的各種規則紛繁複雜，不瞭解索引的組織形式就沒辦法真正地理解資料庫索引。通過本文，你可以深入地理解資料庫索引在資料庫中究竟是如何組織的，從此以後索引的規則對於你將變得清清楚楚、明明白白，再也不需要死記硬背。

順暢地閱讀這篇文章需要了解索引、聯合索引、聚集索引分別都是什麼，如果你還不瞭解，可以通過另一篇文章來輕鬆理解——資料庫索引是什麼？新華字典來幫你。

這篇文章是一系列資料庫索引文章中的第二篇，這個系列包括了下面四篇文章：

這一系列涵蓋了資料庫索引從理論到實踐的一系列知識，一站式解決了從理解到融會貫通的全過程，相信每一篇文章都可以給你帶來更深入的體驗。

索引的組織形式

通過之前的內容，我們已經對資料庫索引有了相當程度的抽象瞭解，那麼在資料庫中，索引實際是以什麼樣的形式進行組織的呢？同一張表上的多個索引又是怎樣分工合作的呢？

目前絕大多數情況下使用的資料庫索引都是使用B+樹實現的，下面就以MySQL的InnoDB為例，介紹一下資料庫索引的具體實現。

聚集索引

下面是一個以B+樹形式組織的拼音索引，在B+樹中，每一個節點裡都有N個按順序排列的值，且每個值的中間和節點的頭尾都有指向下一級節點的指標。在查詢過程中，按順序從頭到尾遍歷一個節點中的值，當發現要找的目標值恰好在一個指標的前一個值之後、後一個值之前時，就通過這個指標進入下一級節點。當最後到達葉子節點，也就是最下層的節點時，就能夠找到自己希望查詢的資料記錄了。

在上圖中如果希望找到險字，那麼我們首先通過拼音首字母在根節點上按順序查詢到了X和Y之間的指標，然後通過這個指標進入了第二級節點···, xia, xian, xiang, ···。之後在該節點上找到了xian和xiang之間的指標，這樣就定位到了第519頁開始的一個目標資料塊，其中就包含了我們想要找到的險字。

因為拼音索引是聚集索引，所以我們在葉子節點上直接就找到了我們想找的資料。

非聚集索引

下面是一個模擬部首索引的組織形式。我們由根節點逐級往下查詢，但是在最後的葉子節點上並沒有找到我們想找的資料，那麼在使用這個索引時我們是如何得到最終的結果的呢？回憶之前字典中“檢字表”的內容，我們可以看到，在每個字邊上都有一個頁碼，這就相當於下面這一個索引中葉子節點上險字與院字中間的指標，這個指標會告訴我們真正的資料在什麼地方。

下圖中，我們把非聚集索引（部首索引）和聚集索引（拼音索引）合在一起就能看出非聚集索引最後到底如何查詢到實際資料了。非聚集索引葉子節點上的指標會直接指向聚集索引的葉子節點，因為根據聚集索引的定義，所有資料都是按聚集索引組織儲存的，所以所有實際資料都儲存在聚集索引的葉子節點中。而從非聚集索引的葉子節點連結到聚集索引的葉子節點查詢實際資料的過程就叫做——回表。

全覆蓋索引

那麼如果我們只是想要驗證險字的偏旁是否是雙耳旁“阝”呢？這種情況下，我們只要在部首索引中阝下游的葉子節點中找到了險字就足夠了。這種在索引中就獲取到了SQL語句中需要的所有欄位，所以不需要再回表查詢的情況中，這個索引就被稱為這個SQL語句的全覆蓋索引。

在實際的資料庫中，非聚集索引的葉子節點上儲存的“指標”就是聚集索引中所有欄位的值，要獲取一條實際資料，就需要通過這幾個聚集索引欄位的值重新在聚集索引上執行一遍查詢操作。如果資料量不多，這個開銷是非常小的；但如果非聚集索引的查詢結果中包含了大量資料，那麼就會導致回表的開銷非常大，甚至超過不走索引的成本。所以全覆蓋索引可以節約回表的開銷這一點在一些回表開銷很大的情況下就非常重要了。

範圍查詢條件

上圖是一個聯合索引idx_eg(col_a, col_b)的結構，如果我們希望查詢一條滿足條件col_a = 64 and col_b = 128的記錄，那麼我們可以一路確定地往下找到唯一的下級節點最終找到實際資料。這種情況下，索引上的col_a和col_b兩個欄位都能被使用。

但是如果我們將查詢條件改為範圍查詢col_a > 63 and col_b = 128，那麼我們就會需要查詢所有符合條件col_a > 63的下級節點指標，最後不得不遍歷非常多的節點及其子節點。這樣的話對於索引來說就得不償失了，所以在這種情況下，資料庫會選擇直接遍歷所有滿足條件col_a > 63的記錄，而不再使用索引上剩下的col_b欄位。資料庫會從第一條滿足col_a > 63的記錄開始，橫向遍歷之後的所有記錄，從裡面排除掉所有不滿足col_b = 128的記錄。

這就是範圍條件會終止使用聯合索引上的後續欄位的原因。

OA系統，，融會貫通企業資訊化，打破資訊孤島
2020-02-16
融會貫通，並行不悖 | 2022年8月《中國資料庫行業分析報告》精彩搶先看！
2022-08-18
並行資料庫行業
職責驅動設計及狀態模式的融會貫通
2022-12-05
模式
萬智牌設計師談創造力的提升——融會貫通
2019-07-26
Mysql資料庫是如何通過索引定位資料
2020-12-12
MySql資料庫索引
你真的會使用資料庫的索引嗎？
2021-10-18
資料庫索引
資料庫索引
2020-12-09
資料庫索引
indexedDB 資料庫索引
2019-07-22
Index資料庫索引
資料庫索引原理
2020-11-04
資料庫索引
[資料庫]索引失效
2024-07-05
資料庫索引
【Mysql】資料庫索引，百萬資料測試索引效果
2021-05-25
MySql資料庫索引
2-3-4樹對應紅黑樹的實現，紅黑樹的融會貫通！！！
2021-10-17
MySQL資料庫之索引
2018-12-17
MySql資料庫索引
概覽資料庫索引
2023-12-22
資料庫索引
mysql資料庫的索引
2019-05-15
MySql資料庫索引
玩轉資料庫索引
2024-06-25
資料庫索引
資料庫索引層級
2021-12-11
資料庫索引
資料庫的部分索引
2023-01-10
資料庫索引
資料庫之建立索引
2020-12-04
資料庫索引
indexedDB 通過索引查詢資料
2019-07-27
Index索引
資料庫索引的工作原理
2018-04-26
資料庫索引
MySQL資料庫索引簡介
2018-03-16
MySql資料庫索引
資料庫——對索引的理解
2020-09-26
資料庫索引
資料庫索引選擇策略
2024-08-26
資料庫索引
mongodb資料庫如何建立索引？
2021-09-11
MongoDB資料庫索引
將資料庫中資料匯入至solr索引庫
2020-11-11
資料庫Solr索引
資料庫索引背後的資料結構
2019-02-26
資料庫索引資料結構
武林內功，資料庫的索引
2018-11-06
資料庫索引
MySQL 資料庫-索引注意事項
2018-12-16
MySql資料庫索引
關係型資料庫之索引
2018-07-07
資料庫索引
學習資料庫索引機制
2018-08-29
資料庫索引
[貝聊科技]理解資料庫索引
2018-05-29
資料庫索引
SAP中的資料庫表索引
2019-06-24
資料庫索引
idea內建資料庫DataGrip + 索引
2024-07-20
Idea資料庫索引
資料庫索引分裂問題分析
2022-12-07
資料庫索引
H2資料庫文件索引
2020-12-24
資料庫索引
資料庫系列：字首索引和索引長度的取捨
2023-10-27
資料庫索引
資料庫兩大神器【索引和鎖】
2018-07-23
資料庫索引