FAQ系列|MySQL索引之聚集索引

晚來風急發表於2017-08-02

導讀

在MySQL裡,聚集索引和非聚集索引分別是什麼意思,有什麼區別?

在MySQL中,InnoDB引擎表是(聚集)索引組織表(clustered index organize table),而MyISAM引擎表則是堆組織表(heap organize table)。

也有人把聚集索引稱為聚簇索引。

當然了,聚集索引的概念不是MySQL裡特有的,其他資料庫系統也同樣有。

簡言之,聚集索引是一種索引組織形式,索引的鍵值邏輯順序決定了表資料行的物理儲存順序,而非聚集索引則就是普通索引了,僅僅只是對資料列建立相應的索引,不影響整個表的物理儲存順序。

我們先來看看兩種儲存形式的不同之處:

簡單說,IOT表裡資料物理儲存順序和主鍵索引的順序一致,所以如果新增資料是離散的,會導致資料塊趨於離散,而不是趨於順序。而HOT表資料寫入的順序是按寫入時間順序儲存的。

IOT表相比HOT表的優勢是:

  • 範圍查詢效率更高;

  • 資料頻繁更新(聚集索引本身不更新)時,更不容易產生碎片;

  • 特別適合有一小部分熱點資料頻繁讀寫的場景;

  • 通過主鍵訪問資料時快速可達;

IOT表的不足則有:

  • 資料變化如果是離散為主的話,那麼效率會比HOT表差;

HOT表的不足有:

  • 索引回表讀開銷很大;

  • 大部分資料讀取時隨機的,無法保證被順序讀取,開銷大;

每張InnoDB表只能建立一個聚集索引,聚集索引可以由一列或多列組成。

上面說過,InnoDB是聚集索引組織表,它的聚集索引選擇規則是這樣的:

  1. 首先選擇顯式定義的主鍵索引做為聚集索引;

  2. 如果沒有,則選擇第一個不允許NULL的唯一索引;

  3. 還是沒有的話,就採用InnoDB引擎內建的ROWID作為聚集索引;

我們來看看InnoDB主鍵索引的示意圖:
640?wx_fmt=jpeg&tp=webp&wxfrom=5&wx_lazy
圖片來自高效能MySQL

可以看到,在這個索引結構的葉子節點中,節點key值是主鍵的值,而節點的value則儲存其餘列資料,以及額外的ROWID、rollback pointer、trx id等資訊。

結合這個圖,以及上面所述,我們可以知道:在InnoDB表中,其聚集索引相當於整張表,而整張表也是聚集索引。主鍵必然是聚集索引,而聚集索引則未必是主鍵

MyISAM是堆組織表,它沒有聚集索引的概念。

文章轉自老葉茶館公眾號,原文連結:https://mp.weixin.qq.com/s/zwCFu3bEksCNdOEBJdjaBA


相關文章