mysql最佳化索引

pythontab發表於2014-04-16

MySql索引

1索引

1.1索引與目錄

每一本書的前幾頁一般都是目錄，而最後幾頁通常會有一個關鍵字索引。對於資料庫來講系統表（如：sysobjects等）就是目錄，而標欄位上的索引就如同書本後面的關鍵字索引。

資料庫中，目錄（資料字典）和索引的區別：目錄縱向、索引橫向。

1.2影響索引作用的因素

1.2.1區分度（檢索比率）

最佳化器根據統計資訊來生成執行計劃，如果資料庫沒有收集索引的統計資訊，最佳化器就無從下手，只能按部就班，透過全表掃描來執行查詢。所以，新建立的索引需要重新執行統計，否則索引無效。

舉一個例子，有個表TABLE1，其中有一個欄位COL1取值是“1”、“2”、“3”三種，執行統計的結果是告訴資料庫TABLE1中的資料其中欄位COL1的各種取值所佔的比重。示意如下：

“1” － 12%；

“2” － 66%；

“3” － 22%。

假設還有個欄位COL2取值和資料所佔的百分比如下：

“A” － 50%；

“B” － 50%。

則查詢語句1：

select * from TABLE1 where COL1 = “1”and COL2 = “A”，

資料庫最佳化器會優先選擇欄位COL1上的索引來定位表中的資料，因為透過COL1上的索引就可以將結果集迅速定位在一個小範圍內12%。而相反的，對於查詢語句2：

select * from TABLE1 where COL1 = “2”and COL2 = “A”，

資料庫會優先選擇COL2上的索引，因為對於語句2的查詢條件COL2上的索引具有更好的區分度。

從上面可以看出，資料庫的最佳化器通常會優先選擇區分度較高的索引（針對於查詢條件，條件不同選擇的索引可能不同）。

資料庫裡的資料是變化的，所以某個時候採集的統計資訊，過一段時間後可能會過時，甚至誤導資料庫最佳化器，這樣同樣會造成執行效能的低下。所以除了，最初建立索引時需要執行統計，在表中的資料發生變化時也需要執行統計。經驗：當表中資料量變化達到10%時，需要重新執行統計。

1.2.2聚集度

範圍掃描

1.2.3表大小

小型表

中大型表

超大型表

1.2.4業務型別

OLTP和OLAP

1.2.5函式與索引

函式，like語句。。。

Substring(col_name,1, 3)vs. Substring(col_name, 3, 3)

like ‘QQQ% vs. like ‘%QQQ’

1.3索引開銷

效能利器

雙刃劍

索引對插入操作的影響（Oracle）

索引對插入操作的影響（MySQL）

比較索引與促發器對效能的影響

1.4索引總結

使用索引實現關鍵資料的高效訪問。但是需要知道每個索引都會給資料庫更新帶來額外的開銷。這就意味著，低效的索引會給資料庫帶來災難。

對於資料庫，我們必須關注關鍵資料的讀取，為他們提供最高效的訪問路徑。對此，基本策略就是建立索引。在索引提供高效訪問的同時，也帶來了額外的系統開銷。開銷分為磁碟空間的開銷和處理器開銷。下面我們討論一下處理器開銷。每當在表中插入或刪除記錄時，該表的所有索引必須進行相應調整。每當對已建立索引的欄位進行更新時，這種調整也會發生。舉例子說，如果在未建立索引的表中插入資料需要100個單位時間，那麼每增加一個索引就會增加100到250個單位時間。有趣的是，維護索引的開銷與簡單觸發器帶來的開銷大致相當。

在建立索引前線介紹一些最通俗的資訊，這些資訊來自developWorks，列出這些資訊是因為我覺得這些資訊通常情況下是值得參考的：

1.當要在一個合理的時間內結束查詢時，應避免新增索引，因為索引會降慢更新操作的速度並消耗額外的空間。有時候還可能存在覆蓋好幾個查詢的大型索引。

1.基數較大的列很適合用來做索引。

3.考慮到管理上的開銷，應避免在索引中使用多於5個的列。

4.對於多列索引，將查詢中引用最多的列放在定義的前面。

5.避免新增與已有的索引相似的索引。因為這樣會給最佳化器帶來更多的工作，並且會降慢更新操作的速度。相反，我們應該修改已有的索引，使其包含附加的列。例如，假設在一個表的 (c1,c2)上有一個索引i1。您注意到查詢中使用了"wherec2=?"，於是又建立一個(c2)上的索引i2。但是這個相似的索引沒有新增任何東西，它只是i1的冗餘，而現在反而成了額外的開銷。

6.如果表是隻讀的，並且包含很多的行，那麼可以嘗試定義一個索引，透過CREATE INDEX中的INCLUDE子句使該索引包含查詢中引用的所有列（被INCLUDE子句包含的列並不是索引的一部分，而只是作為索引頁的一部分來儲存，以避免附加的資料FETCHES）。

對於資料倉儲（查詢系統資料庫）可以建立較多的索引（索引和資料的比例可以是1：1）。

決定是否使用索引，可以重點考慮檢索比率。即，判斷索引有效性的依據，就使用鍵值作唯一性條件檢索出的資料的百分比。百分比越低，索引越有效。做出這個論斷的前提是一些假設，如磁碟訪問的相關效能。

索引鍵值相關記錄的物理位置是否相鄰也很重要，因為是透過塊來運算元據的。建立了索引之後，如果索引鍵所指向的記錄散佈於整個表中，即使這些記錄在表中佔的比率很小，但因為它們分散在整個磁碟上，所以索引的效能就會大打折扣。

另外值得注意的是，函式和型別轉換可能導致索引失效。

MySQL的索引最佳化
2024-05-19
MySql索引
MySQL 索引使用策略及最佳化
2019-08-07
MySql索引
【MySQL】效能最佳化之覆蓋索引
2016-11-03
MySql索引
MySQL-10.索引最佳化與查詢最佳化
2024-05-23
MySql索引
MySQL索引原理及慢查詢最佳化
2020-09-20
MySql索引
《MySQL 進階篇》十五：索引最佳化和查詢最佳化
2024-09-22
MySql索引
MySQL SQL最佳化 - 覆蓋索引(covering index)
2018-04-21
MySql索引Index
MySQL查詢最佳化方案彙總（索引相關）
2024-03-08
MySql索引
索引@oracel索引技術之索引最佳化
2015-02-06
索引
MySQL 中索引是如何實現的，有哪些型別的索引，如何進行最佳化索引
2023-03-27
MySql索引型別
技術分享 | MySQL 覆蓋索引最佳化案例一則
2023-02-09
MySql索引
Elasitcsearch索引最佳化
2018-11-16
索引
mysql千萬級資料量根據索引最佳化查詢速度
2021-09-09
MySql索引
Oracle 索引的最佳化
2016-09-23
Oracle索引
SQL最佳化(一) 索引
2016-09-13
SQL索引
《PostgreSQL》索引與最佳化
2024-03-06
SQL索引
mysql索引之字首索引
2019-08-20
MySql索引
ElasticSearch 索引 VS MySQL 索引
2020-10-09
Elasticsearch索引MySql
MySQL — 索引
2022-03-22
MySql索引
mysql索引
2024-05-11
MySql索引
[Mysql]索引
2024-07-05
MySql索引
MySQL 索引
2024-10-13
MySql索引
mysql 索引( mysql index )
2014-10-10
MySql索引Index
基於滴滴雲 MySQL 驗證索引最佳化簡單查詢
2019-01-28
MySql索引
深入探討MySQL索引的設計原則及最佳化策略
2024-08-04
MySql索引
SQL效能最佳化之索引最佳化法
2021-07-28
SQL索引
MySQL索引系列：全文索引
2020-11-07
MySql索引
MySQL 索引 +explain
2019-05-17
MySql索引AI
MySQL索引原理
2019-07-25
MySql索引
MySQL InnoDB 索引
2021-05-24
MySql索引
MySQL 索引初探
2018-11-09
MySql索引
MySQL 二索引
2020-11-02
MySql索引
Mysql索引使用
2024-01-12
MySql索引
MySQL之索引
2017-08-27
MySql索引
mysql新增索引
2015-12-20
MySql索引
MySQL的索引
2024-10-09
MySql索引
mysql組合索引，abc索引命中
2020-09-23
MySql索引
Mysql索引結構與索引原理
2017-09-22
MySql索引

mysql最佳化索引

相關文章