面試必備的索引優化

weixin_34402408發表於2017-11-16

面試索引優化

關於索引，分為以下幾點來講解（技術文）：

索引的概述(什麼是索引,索引的優缺點)

索引的基本使用（建立索引）

索引的基本原理（面試重點）

索引的資料結構（B樹，hash）

建立索引的原則（重中之重，面試必問！敬請收藏！）

百萬級別或以上的資料如何刪除

一、索引的概述

1）什麼是索引？

索引是一種特殊的檔案(InnoDB資料表上的索引是表空間的一個組成部分)，它們包含著對資料表裡所有記錄的引用指標。更通俗的說，索引就相當於目錄。當你在用新華字典時，幫你把目錄撕掉了，你查詢某個字開頭的成語只能從第一頁翻到第一千頁。累！把目錄還給你，則能快速定位！

2）索引的優缺點：

可以大大加快資料的檢索速度，這也是建立索引的最主要的原因。，且通過使用索引，可以在查詢的過程中，使用優化隱藏器，提高系統的效能。但是，索引也是有缺點的：索引需要額外的維護成本；因為索引檔案是單獨存在的檔案,對資料的增加,修改,刪除,都會產生額外的對索引檔案的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執行效率。

二、索引的基本使用（真技術文）

1）建立索引：（三種方式）

第一種方式：

第二種方式：使用ALTER TABLE命令去增加索引：

ALTER TABLE用來建立普通索引、UNIQUE索引或PRIMARY KEY索引。

其中table_name是要增加索引的表名，column_list指出對哪些列進行索引，多列時各列之間用逗號分隔。

索引名index_name可自己命名，預設時，MySQL將根據第一個索引列賦一個名稱。另外，ALTER TABLE允許在單個語句中更改多個表，因此可以在同時建立多個索引。

第三種方式：使用CREATE INDEX命令建立

CREATE INDEX可對錶增加普通索引或UNIQUE索引。（但是，不能建立PRIMARY KEY索引）

三、索引的基本原理（不想像別的文章那樣一大堆篇幅廢話）

索引用來快速地尋找那些具有特定值的記錄。如果沒有索引，一般來說執行查詢時遍歷整張表。

索引的原理很簡單，就是把無序的資料變成有序的查詢

1、把建立了索引的列的內容進行排序

2、對排序結果生成倒排表

3、在倒排表內容上拼上資料地址鏈

4、在查詢的時候，先拿到倒排表內容，再取出資料地址鏈，從而拿到具體資料

四、索引的資料結構（b樹，hash）

1）B樹索引

mysql通過儲存引擎取資料，基本上90%的人用的就是InnoDB了，按照實現方式分，InnoDB的索引型別目前只有兩種：BTREE（B樹）索引和HASH索引。B樹索引是Mysql資料庫中使用最頻繁的索引型別，基本所有儲存引擎都支援BTree索引。通常我們說的索引不出意外指的就是（B樹）索引（實際是用B+樹實現的，因為在檢視錶索引時，mysql一律列印BTREE，所以簡稱為B樹索引）

查詢方式：

主鍵索引區:PI(關聯儲存的時資料的地址)按主鍵查詢,

普通索引區:si(關聯的id的地址,然後再到達上面的地址)。所以按主鍵查詢,速度最快

B+tree性質：

1.）n棵子tree的節點包含n個關鍵字，不用來儲存資料而是儲存資料的索引。

2.）所有的葉子結點中包含了全部關鍵字的資訊，及指向含這些關鍵字記錄的指標，且葉子結點本身依關鍵字的大小自小而大順序連結。

3.）所有的非終端結點可以看成是索引部分，結點中僅含其子樹中的最大（或最小）關鍵字。

4.）B+ 樹中，資料物件的插入和刪除僅在葉節點上進行。

5.）B+樹有2個頭指標，一個是樹的根節點，一個是最小關鍵碼的葉節點。

2）雜湊索引（好技術文）

簡要說下，類似於資料結構中簡單實現的HASH表（雜湊表）一樣，當我們在mysql中用雜湊索引時，主要就是通過Hash演算法（常見的Hash演算法有直接定址法、平方取中法、摺疊法、除數取餘法、隨機數法），將資料庫欄位資料轉換成定長的Hash值，與這條資料的行指標一併存入Hash表的對應位置；如果發生Hash碰撞（兩個不同關鍵字的Hash值相同），則在對應Hash鍵下以連結串列形式儲存。當然這只是簡略模擬圖。

ps：關於資料結構，有興趣深入的朋友可以關注我後檢視【資料結構】專題，這裡不做詳細講解。

五、建立索引的原則（重中之重）

索引雖好，但也不是無限制的使用，最好符合一下幾個原則

1）最左字首匹配原則，組合索引非常重要的原則，mysql會一直向右匹配直到遇到範圍查詢(>、<、between、like)就停止匹配，比如a = 1 and b = 2 and c > 3 and d = 4 如果建立(a,b,c,d)順序的索引，d是用不到索引的，如果建立(a,b,d,c)的索引則都可以用到，a,b,d的順序可以任意調整。

2）較頻繁作為查詢條件的欄位才去建立索引

3）更新頻繁欄位不適合建立索引

4）若是不能有效區分資料的列不適合做索引列(如性別，男女未知，最多也就三種，區分度實在太低)

5）儘量的擴充套件索引，不要新建索引。比如表中已經有a的索引，現在要加(a,b)的索引，那麼只需要修改原來的索引即可。

6）定義有外來鍵的資料列一定要建立索引。

7）對於那些查詢中很少涉及的列，重複值比較多的列不要建立索引。

8）對於定義為text、image和bit的資料型別的列不要建立索引。

百萬級別或以上的資料如何刪除（真好技術文）

關於索引：由於索引需要額外的維護成本，因為索引檔案是單獨存在的檔案,所以當我們對資料的增加,修改,刪除,都會產生額外的對索引檔案的操作,這些操作需要消耗額外的IO,會降低增/改/刪的執行效率。所以，在我們刪除資料庫百萬級別資料的時候，查詢MySQL官方手冊得知刪除資料的速度和建立的索引數量是成正比的。

所以我們想要刪除百萬資料的時候可以先刪除索引（此時大概耗時三分多鐘）

然後刪除其中無用資料（此過程需要不到兩分鐘）

刪除完成後重新建立索引(此時資料較少了)建立索引也非常快，約十分鐘左右。

與之前的直接刪除絕對是要快速很多，更別說萬一刪除中斷,一切刪除會回滾。那更是坑了。

MySQL面試必備一之索引
2024-03-31
MySql面試索引
面試必備之MYSQL索引底層原理分析
2019-03-08
面試MySql索引
sql優化面試必問【簡答】
2020-11-26
SQL優化面試
Maven面試必備
2019-05-21
Maven面試
理解索引：索引優化
2018-06-04
索引優化
Oracle 索引的優化
2015-12-30
Oracle索引優化
「mysql優化專題」程式設計師面試都用得上的索引優化手冊(5)【面試重點】
2018-09-24
MySql優化程式設計師面試索引
MSSQL優化之索引優化
2009-04-15
SQL優化索引
Mysql索引優化之索引的分類
2019-07-04
MySql索引優化
深入淺出Mysql索引優化專題分享|面試怪圈
2021-12-19
MySql索引優化面試
面試必備，Linux面試題和答案！
2024-04-22
Linux面試題
Elasitcsearch索引優化
2018-11-15
索引優化
MySQL索引優化
2021-01-05
MySql索引優化
mysql優化索引
2020-12-23
MySql優化索引
SQL優化-索引
2013-11-15
SQL優化索引
MySQL 效能優化之索引優化
2015-04-01
MySql優化索引
面試必備的分散式事務方案
2019-04-20
面試分散式
面試必備的「反轉連結串列」
2020-10-19
面試
【面試必備】javascript的原型和繼承
2014-01-03
面試JavaScript原型繼承
AI工程師必備技能 - 凸優化介紹
2019-01-23
AI工程師優化
Java 最常見的 200+ 面試題：面試必備
2021-12-23
Java面試題
必懂的wenpack優化
2019-07-27
優化
使用Elasticsearch的動態索引和索引優化
2019-03-28
Elasticsearch索引優化
面試必備之 Java 集合框架
2020-07-03
面試Java框架
面試必備：SparseArray原始碼解析
2019-03-03
面試原始碼
面試必備：List 演算法
2019-03-02
面試演算法
騰訊 PHP 面試必備知識
2019-05-09
PHP面試
面試必備問題集錦
2021-04-14
面試
Redis 面試必備知識點
2021-05-05
Redis面試
面試必備：陣列和字串
2018-08-20
面試陣列字串
BAT面試必備——Java 集合類
2018-09-08
BAT面試Java
java Integer 原始碼面試必備
2018-03-06
Java原始碼面試
面試必備：ArrayMap原始碼解析
2017-10-24
面試原始碼
【面試必備】javascript操作DOM元素
2013-12-27
面試JavaScript
MySQL面試必備三之事務
2024-05-18
MySql面試
【面試必備】常見Java面試題大綜合
2018-12-24
Java面試題
mysql索引的使用和優化
2018-10-25
MySql索引優化
全文索引的效能優化
2008-12-22
索引優化

面試必備的索引優化

相關文章