Sql Server之旅——第七站為什麼都說狀態少的欄位不能建索引

一線碼農發表於2015-01-29

　　我們在學sqlserver的時候，大多教科書和前輩們都說狀態少的欄位不要建索引，由此帶來的開銷還不如不建索引，但是這句話有多少人真的知道，

或者說有多少人真的對此有比較深刻的理解，而不是聽別人道聽途說。。。這樣記得快，忘記的也不慢。。。這篇我來分析一下這句話到底有幾個意思。

一：現象

　首先我們還是用測試資料來發現問題，我先建立一個Person，有5個欄位，建表sql如下：

DROP TABLE dbo.Person

CREATE TABLE Person(ID INT PRIMARY KEY IDENTITY,NAME VARCHAR(900),Age INT,Email VARCHAR(20),isMan INT )

-- 在isMan欄位建立非聚集索引（0：女 1：男）
CREATE INDEX idx_isMan ON dbo.Person(isMan)

DECLARE @ch AS INT=0

WHILE @ch<=100000
BEGIN
    INSERT INTO dbo.Person(NAME,Age,Email,isMan) 
    VALUES
    (
      REPLICATE(CHAR(@ch),50),
      @ch,
      CAST(CAST(RAND()*1000000000 AS INT) AS VARCHAR(10))+'qq.com',
      @ch%2
    )
    SET @ch=@ch+1
END

通過上面的sql可以發現表中有5個欄位，ID為聚集索引，isMan為非聚集索引，isMan也就是兩種狀態（0,1），並且插入10w條記錄，截圖如下：

sql都做完了，接下來要做的事情就是查詢下： isMan=1的記錄，如下圖：

麻蛋。。。。哥哥明明是在isMan上做資料檢索的，怎麼就變成 “聚集索引掃描”了？？？這他麼的什麼意思嘛，居然不走我的“idx_isMan”索引，

卻走他麼的“聚集索引(PK__Person__3214EC276EF57B66)”。。。。同時也看到上面的”邏輯讀取”為521。。。說明在記憶體中走了521個資料頁。

但是我不服呀。。。我一定要讓執行計劃走我的索引。。。辦法就是強制指定。。。如下圖。

看到上面的圖，你是不是已經瘋了。。。老子才撈5w的資料，你給我走了10w多次資料頁。。。這麼說1條記錄要走兩個資料頁。。。而掃描聚集

索引才走521個資料頁，相差200倍。。。難怪執行計劃打死也不走“idx_isMan”這條索引。。。要是這樣走了人家還不拿刀捅了sqlserver麼？？？

二：分析原因

　　現在很生氣，整個人都不好了，為什麼會這樣？？？為了找出問題，我們還得看資料頁。

1 DBCC TRACEON(3604,2588)
2 DBCC IND(Ctrip,Person,-1)

通過上面的三個圖，大概可以看到，10w條資料用了697資料頁，其中聚集索引有521個，非聚集索引為176個，這也說明了上面的”聚集索引掃描“走

遍了它自己所有的資料頁來才撈出資料，同時還發現這兩個索引都有一個共同特徵就是，只有一個根節點(indexLevel=1）和無數個（indexLevel=0）

葉子節點，然後我腦子裡面就有一幅圖出來了。。。

上面就是我構思出來的圖，這個專業一點的名字叫做書籤查詢。。。我們通過建立”idx_isMan“索引後，就會構建右半圖的B樹結構，其中索引記錄

會存放兩個值，一個是索引值isMan和一個聚集索引值ID，如果你不相信的話，可以通過DBCC Page去探索"idx_isMan"的索引頁，你也可以通過

DBCC SHOW_STATISTICS 去檢視，如圖：

然後引擎通過“idx_isMan“掃描後，拿到了key值，但是非常可惜，我是select * 的，所以必須還要噴出記錄中的Name，Emai等l欄位，但是

”index_isMan"中並沒有儲存這幾個欄位，所以必須通過key去”聚集索引“的B樹中去找。。。最後通過”聚集索引“的B樹找到了目標記錄，這也

就是所謂的執行計劃中的”鍵查詢“，然後噴出”Name，Email“等欄位。。。。問題就在這裡。。。因為我這樣來回的蹦躂蹦躂。。。造成了找出

完整的一個記錄，需要蹦躂2-3次資料頁。。。具體的尋找記錄，可參考圖中的”紫色線條“，最後也就造成了10w多次蹦躂。。。

三：啟示

那這個例子給我們什麼啟示呢？？？仔細想想你就知道。。。使用非聚集索引，千萬不要撈取過多的資料。。。因為過多的資料會造成在多個

B樹中來回的蹦躂。。。想要做到撈取資料較少，就必須在高唯一性的欄位上建立索引，這樣的話在非聚集索引B樹中符合的資料相對較少，也就

減少了我蹦躂到”主鍵索引“的B樹次數。。。這樣的話來回蹦躂的次數遠遠比”聚集索引“掃描來的實惠，對不對。。。

所以結論出來了：必須在唯一性較高的欄位上建立非聚集索引。

Spring中為什麼不建議使用欄位注入
2021-08-23
Spring
隨筆：MySQL 查詢事務狀態欄位說明
2019-08-27
MySql
都說不要讓Macbook始終保持100％充電狀態，但你知道為什麼嗎？
2020-07-13
Mac
為什麼說.gitignore不能忽視
2020-08-24
Git
SQL Server 查詢表註釋和欄位
2020-12-07
SQLServer
SQL Server索引 - 非聚集索引
2019-01-08
SQLServer索引
TCP為什麼是有狀態的？
2024-12-08
TCP
SQLServer索引優化（1）：對於有order by欄位的建索引策略
2020-09-16
SQLServer索引優化
SQL Server中獲取資料庫名、表名、欄位名和欄位註釋的SQL語句
2021-03-24
SQLServer資料庫
SQL Server 2014的重建索引
2019-02-05
SQLServer索引
怎麼給字串欄位加索引？
2022-03-05
字串索引
SQL Server為什麼這麼耗記憶體
2021-09-09
SQLServer記憶體
外來鍵欄位未建索引引發的死鎖
2019-05-17
索引
SQL Server 索引結構
2022-02-24
SQLServer索引
欄位管理，為什麼只有新增的時候才自動匹配欄位型別
2020-04-04
型別
為什麼說Spark SQL遠遠超越了MPP SQL
2021-09-09
SparkSQL
laravel欄位減少增加
2020-11-13
Laravel
為什麼資料庫欄位要使用NOT NULL？
2021-04-05
資料庫Null
在 SQL Server 中，建立表時可以直接為欄位新增唯一約束（UNIQUE）
2024-11-17
SQLServer
位運算-設計資料庫表的多選狀態欄位
2022-11-24
資料庫
最佳化SQL Server索引的技巧
2020-05-21
SQLServer索引
[20181020]lob欄位的索引段.txt
2018-10-21
索引
網站常用的狀態碼有什麼？網路安全技學習什麼
2021-03-05
網站
為什麼說CDN有利於網站
2022-09-01
網站
為什麼Android原始碼中都使用16進位制進行狀態管理？
2021-06-01
Android原始碼
多表關聯查詢中，關聯欄位都應該建立索引嗎？
2021-03-25
索引
為什麼HTML不能巢狀PHP,而PHP檔案卻可以巢狀HTML
2018-12-15
HTML巢狀PHP
oracle複合索引介紹(多欄位索引)
2019-05-10
Oracle索引
Mysql varchar型別欄位為什麼經常定義為255
2021-12-14
MySql型別
vs2005 建ASP.NET 網站設計裡的控制元件為什麼不能拖動
2020-04-05
ASP.NET網站控制元件
網站建設之企業為什麼要做網站？
2021-01-12
網站
AQS 都看完了，Condition 原理可不能少！
2020-10-01
AQS
這個大表走索引欄位查詢的 SQL 怎麼就成全掃描了，我TM人傻了
2021-08-07
索引SQL
為什麼個人和企業都需要有個網站？
2018-05-20
網站
MySQL索引那些事：什麼是索引？為什麼加索引就查得快了？
2021-06-09
MySql索引
[提問交流]為什麼我自己在資料庫新增的欄位，在後臺都無法進行操作
2020-04-04
資料庫
PG裡常見的欄位有索引但未使用索引的原因
2023-05-05
索引
什麼？你還不會用位運算來操作狀態？
2019-08-09
Kotlin 什麼是幕後欄位？
2018-09-09
Kotlin

Sql Server之旅——第七站 為什麼都說狀態少的欄位不能建索引

相關文章

Sql Server之旅——第七站為什麼都說狀態少的欄位不能建索引