新功能初探 | MySQL 8.0 Multi-Valued Indexes功能簡述

芊寶寶最可愛發表於2019-12-05

顧名思義,索引上對於同一個Primary key, 可以建立多個二級索引項,實際上已經對array型別的基礎功能做了支援,並基於array來構建二級索引。

這意味著該二級索引的記錄數可以是多於聚集索引記錄數的,因而該索引不可以用於通常意義的查詢,只能透過特定的介面函式來使用,下面的例子裡會說明。

範例

摘錄自官方文件
*請左右滑動閱覽

root@test 04:08:50>show create table customers\G                                                                                                                                  
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `modified` datetime DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
  `custinfo` json DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `zips` ((cast(json_extract(`custinfo`,_latin1'$.zip') as unsigned array)))
) ENGINE=InnoDB AUTO_INCREMENT=6 DEFAULT CHARSET=latin1
1 row in set (0.00 sec)
root@test 04:08:53>select * from customers;
+----+---------------------+-------------------------------------------------------------------+
| id | modified            | custinfo                                                          |
+----+---------------------+-------------------------------------------------------------------+
|  1 | 2019-08-14 16:08:50 | {"user": "Jack", "user_id": 37, "zipcode": [94582, 94536]}        |
|  2 | 2019-08-14 16:08:50 | {"user": "Jill", "user_id": 22, "zipcode": [94568, 94507, 94582]} |
|  3 | 2019-08-14 16:08:50 | {"user": "Bob", "user_id": 31, "zipcode": [94477, 94536]}         |
|  4 | 2019-08-14 16:08:50 | {"user": "Mary", "user_id": 72, "zipcode": [94536]}               |
|  5 | 2019-08-14 16:08:50 | {"user": "Ted", "user_id": 56, "zipcode": [94507, 94582]}         |
+----+---------------------+-------------------------------------------------------------------+
5 rows in set (0.00 sec)

透過如下三個函式member of, json_contains, json_overlaps可以使用到該索引

*請左右滑動閱覽

root@test 04:09:00>SELECT * FROM customers WHERE 94507 MEMBER OF(custinfo->'$.zipcode');
+----+---------------------+-------------------------------------------------------------------+
| id | modified            | custinfo                                                          |
+----+---------------------+-------------------------------------------------------------------+
|  2 | 2019-08-14 16:08:50 | {"user": "Jill", "user_id": 22, "zipcode": [94568, 94507, 94582]} |
|  5 | 2019-08-14 16:08:50 | {"user": "Ted", "user_id": 56, "zipcode": [94507, 94582]}         |
+----+---------------------+-------------------------------------------------------------------+
2 rows in set (0.00 sec)
root@test 04:09:41>SELECT * FROM customers  WHERE JSON_CONTAINS(custinfo->'$.zipcode', CAST('[94507,94582]' AS JSON));
+----+---------------------+-------------------------------------------------------------------+
| id | modified            | custinfo                                                          |
+----+---------------------+-------------------------------------------------------------------+
|  2 | 2019-08-14 16:08:50 | {"user": "Jill", "user_id": 22, "zipcode": [94568, 94507, 94582]} |
|  5 | 2019-08-14 16:08:50 | {"user": "Ted", "user_id": 56, "zipcode": [94507, 94582]}         |
+----+---------------------+-------------------------------------------------------------------+
2 rows in set (0.00 sec)
root@test 04:09:54>SELECT * FROM customers   WHERE JSON_OVERLAPS(custinfo->'$.zipcode', CAST('[94507,94582]' AS JSON));
+----+---------------------+-------------------------------------------------------------------+
| id | modified            | custinfo                                                          |
+----+---------------------+-------------------------------------------------------------------+
|  1 | 2019-08-14 16:08:50 | {"user": "Jack", "user_id": 37, "zipcode": [94582, 94536]}        |
|  2 | 2019-08-14 16:08:50 | {"user": "Jill", "user_id": 22, "zipcode": [94568, 94507, 94582]} |
|  5 | 2019-08-14 16:08:50 | {"user": "Ted", "user_id": 56, "zipcode": [94507, 94582]}         |
+----+---------------------+-------------------------------------------------------------------+
3 rows in set (0.00 sec)

介面函式

multi-value index是functional index的一種實現,列的定義是一個虛擬列,值是從json column上取出來的陣列。

陣列上存在相同值的話,會只儲存一個到索引上。支援的型別:DECIMAL, INTEGER, DATETIME,VARCHAR/CHAR。另外index上只能有一個multi-value column。
下面簡單介紹下相關的介面函式

陣列最大容量:

入口函式:
ha_innobase::mv_key_capacity

插入記錄:

入口函式:
row_ins_sec_index_multi_value_entry
透過類Multi_value_entry_builder_insert來構建tuple, 然後呼叫正常的介面函式row_ins_sec_index_entry插入到二級索引中。
已經解析好,排序並去重的資料儲存在結構struct multi_value_data , 指標在dfield_t::data中. multi_value_data結構也是multi-value具體值的記憶體表現

刪除記錄:

入口函式:
row_upd_del_multi_sec_index_entry
基於類Multi_value_entry_builder_normal構建tuple, 並依次從索引中刪除

更新記錄

入口函式:
row_upd_multi_sec_index_entry
由於可能不是所有的二級索引記錄都需要更新,需要計算出diff,找出要更新的記錄calc_row_difference --> innobase_get_multi_value_and_diff, 設定一個需要更新的bitmap

事務回滾

相關函式:

row_undo_ins_remove_multi_sec
row_undo_mod_upd_del_multi_sec
row_undo_mod_del_mark_multi_sec

回滾的時候透過trx_undo_rec_get_multi_value從undo log中獲取multi-value column的值,透過介面Multi_value_logger::read來構建並儲存到field data中

記錄undo log

函式: trx_undo_store_multi_value
透過Multi_value_logger::log將multi-value的資訊儲存到Undo log中. 'Multi_value_logger'是一個輔助類,用於記錄multi-value column的值以及如何讀出來

purge 二級索引記錄

入口函式:
*請左右滑動閱覽

row_purge_del_mark
row_purge_upd_exist_or_extern_func
    |--> row_purge_remove_multi_sec_if_poss

原文連結

本文為雲棲社群原創內容,未經允許不得轉載。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69949601/viewspace-2667135/,如需轉載,請註明出處,否則將追究法律責任。

相關文章