【Mysql】MySQL 5.7新特性之Generated Column(函式索引)

小亮520cl發表於2016-01-08
  1. 原文地址
  2.  http://mp.weixin.qq.com/s?__biz=MjM5MjIxNDA4NA==&mid=400998070&idx=1&sn=a3fd251ddd047e089e80cae5d4d90c34&scene=0#wechat_redirect

  1.  正文 

  1. MySQL 5.7引入了Generated Column,這篇文章簡單地介紹了Generated Column的使用方法和注意事項,為讀者瞭解MySQL 5.7提供一個快速的、完整的教程。這篇文章圍繞以下幾個問題展開: 
  2. Generated Column是什麼 
  3. Virtual Column與Stored Column的區別 
  4. 如果我對Generated Column做一些破壞行為會怎麼樣 
  5. Generated Column上建立索引 
  6. Generated Column上建立索引與Oracle的函式索引的區別 

  7. Generated Column是什麼 

  8. Generated Column是MySQL 5.7引入的新特性,所謂Cenerated Column,就是資料庫中這一列由其他列計算而得,我們以官方參考手冊中的例子予以說明。 


  9. 例如,知道直角三角形的兩條直角邊,要求斜邊的長度。很明顯,斜邊的長度可以透過兩條直角邊計算而得,那麼,這時候就可以在資料庫中只存放直角邊,斜邊使用Generated Column,如下所示: 

  10. CREATE TABLE triangle ( 
  11. sidea DOUBLE, 
  12. sideb DOUBLE, 
  13. sidec DOUBLE AS (SQRT(sidea * sidea + sideb * sideb))); 

  14. INSERT INTO triangle (sidea, sideb) VALUES(1,1),(3,4),(6,8); 

  15. 查詢結果: 

  16. mysql> SELECT * FROM triangle; 
  17. +-------+-------+--------------------+ 
  18. | sidea | sideb | sidec | 
  19. +-------+-------+--------------------+ 
  20. | 1 | 1 | 1.4142135623730951 | 
  21. | 3 | 4 | 5 | 
  22. | 6 | 8 | 10 | 
  23. +-------+-------+--------------------+ 

  24. 這個例子就足以說明Generated Columns是什麼,以及怎麼使用用了。 


  25. Virtual Generated Column與Stored Generated Column的區別 

  26. 在MySQL 5.7中,支援兩種Generated Column,即Virtual Generated Column和Stored Generated Column,前者只將Generated Column儲存在資料字典中(表的後設資料),並不會將這一列資料持久化到磁碟上;後者會將Generated Column持久化到磁碟上,而不是每次讀取的時候計算所得。很明顯,後者存放了可以透過已有資料計算而得的資料,需要更多的磁碟空間,與Virtual Column相比並沒有優勢,因此,MySQL 5.7中,不指定Generated Column的型別,預設是Virtual Column。此外: 
  27. Stored Generated Column效能較差,見這裡 
  28. 如果需要Stored Generated Golumn的話,可能在Generated Column上建立索引更加合適,見本文第4部分的介紹 

  29. 綜上,一般情況下,都使用Virtual Generated Column,這也是MySQL預設的方式,如果使用Stored Generated Column,前面的建表語句將會是下面這樣,即多了一個stored關鍵字: 

  30. Create Table: CREATE TABLE `triangle` ( 
  31.  `sidea` double DEFAULT NULL, 
  32.  `sideb` double DEFAULT NULL, 
  33.  `sidec` double GENERATED ALWAYS AS (SQRT(sidea * sidea + sideb * sideb)) STORED) 


  1. 如果對generated column做一些破壞行為會怎麼樣? 

  2. 我們已經知道了generated column是什麼,並且知道了如何使用generated column,為了避免誤用,我們先來進行一些實驗,以免在具體使用時出現一些未知的情況。 

  3. 將generated column定義為 "除以0" 

  4. 如果我們將generated column定義為 "x列 / 0",MySQL並不會直接報錯,而是在插入資料時報錯,並提示"ERROR 1365 (22012): Division by 0" 
  5.   
  6. mysql> create table t( x int, y int, z int generated always as( x / 0)); 
  7. Query OK, 0 rows affected (0.22 sec) 
  8.  
  9. mysql> insert into t(x,y) values(1,1); 
  10. ERROR 1365 (22012): Division by 0 


  11. 插入惡意資料 
  12. 如果我們將generated column定義為 "x列/y列",在插入資料,如果y列為0的話,同樣提示錯誤,如下所示: 

  13. mysql> create table t( x int, y int, z int generated always as( x / y)); 
  14. Query OK, 0 rows affected (0.20 sec) 

  15. mysql> insert into t(x,y) values(1,0); 
  16. ERROR 1365 (22012): Division by 0 


  1. 刪除源列 
  2.   
  3. 如果我們將generated column定義為 "x列/y列",並嘗試刪除x列或y列,將提示"ERROR 3108 (HY000): Column 'x' has a generated column dependency." 

  4. mysql> create table t( x int, y int, z int generated always as( x / y)); 
  5. Query OK, 0 rows affected (0.24 sec) 

  6. mysql> alter table t drop column x; 
  7. ERROR 3108 (HY000): Column 'x' has a generated column dependency. 


  1. 定義顯然不合法的Generated Column 
  2.   
  3. 如果我們將generated column定義為 "x列+y列",很明顯,x列或y列都是數值型,如果我們將x列或y列定義(或修改)為字元型(當然,實際使用時應該不會有人傻到這樣去做),則預期會報錯,然而並沒有,如下所示,我們可以正常建立。 

  4.  mysql> create table t( x int, y varchar(100), z int generated always as( x + y)); 
  5.  Query OK, 0 rows affected (0.13 sec) 

  6. 並且插入如下這樣的資料也不會出錯: 

  7. mysql> insert into t(x,y) values(1,'0'); 
  8. Query OK, 1 row affected (0.01 sec) 

  9. mysql> select * from t; 
  10. +------+------+------+ 
  11. | x | y | z | 
  12. +------+------+------+ 
  13. | 1 | 0 | 1 | 
  14. +------+------+------+ 
  15. 1 row in set (0.00 sec) 

  16. 但是對於MySQL無法處理的情況,則會報錯: 

  17. mysql> insert into t(x,y) values(1,'x'); 
  18. ERROR 1292 (22007): Truncated incorrect DOUBLE value: 'x' 

  19. Generated Column上建立索引 

  20. 同樣,我們可以在generated column上建立索引,建立索引以後,能夠加快查詢速度,如下所示: 

  21. mysql> create table t(int primary key, y int, z int generated always as (x / y), unique key idz(z)); 
  22. Query OK, 0 rows affected (0.11 sec) 

  23. mysql> show create table t\G 
  24. *************************** 1. row *************************** 
  25. Table: t 
  26. Create Table: CREATE TABLE `t` (
  27.   `x` int(11) NOT NULL,
  28.   `y` int(11) DEFAULT NULL,
  29.   `z` int(11) GENERATED ALWAYS AS (x / y) VIRTUAL,
  30.   PRIMARY KEY (`x`),
  31.   UNIQUE KEY `idz` (`z`)) ENGINE=InnoDB DEFAULT CHARSET=latin1 
  32. 1 row in set (0.01 sec) 

  33.   
  34. 並且,我們可以建立普通索引和唯一索引,如果是唯一索引,在違反了唯一性約束時,進行報錯: 

  35. mysql> insert into t(x,y) values(1,1); 
  36. Query OK, 1 row affected (0.02 sec) 

  37. mysql> insert into t(x,y) values(2,2); 
  38. ERROR 1062 (23000): Duplicate entry '1' for key 'idz' 

  39.   
  40. 所以,在使用MySQL5.7時,還需要對Generated Column有所瞭解,才能夠解決一些以前沒有遇到過的問題。 


  1. 索引的限制 

  1. 雖然一般情況下都應該使用Virtal Generated Column,但是,目前使用Virtual Generated Column還有很多限制,包括: 

  2.   
  3. 聚集索引不能包含virtual generated column 

  4. mysql> create table t1(int, b int , c int GENERATED ALWAYS AS (a / b), primary key(c)); 
  5. ERROR 3106 (HY000): 'Defining a virtual generated column as primary key' is not supported for generated columns. 

  6. mysql> create table t1(int, b int , c int GENERATED ALWAYS AS (a / b) STORED, primary key(c)); 
  7. Query OK, 0 rows affected (0.11 sec) 

  8. 不能在Virtual Generated Column上建立全文索引和空間索引,這個在之後的MySQL版本中有望解決(Inside君咋記得Stored Column上市可以的呢?)。 

  9. Virtual Generated Column不能作為外來鍵 

  10. 建立generated column(包括virtual generated column 和stored generated column)時不能使用非確定性的(不可重複的)函式 

  11. mysql> ALTER TABLE `t1` ADD p3 DATE GENERATED ALWAYS AS (curtime()) virtual; 
  12. ERROR 3102 (HY000): Expression of generated column 'p3' contains a disallowed function. 

  13. mysql> ALTER TABLE `t1` ADD p3 DATE GENERATED ALWAYS AS (curtime()) stored; 
  14. ERROR 3102 (HY000): Expression of generated column 'p3' contains a disallowed function. 




  1. Generated Column上建立索引與Oracle的函式索引的區別 

  1. 介紹完MySQL在Generated Column上的索引,熟悉Oracle的同學這時候可能會想起Oracle的函式索引,在MySQL的Generated Column列上建立索引與Oracle的函式索引比較類似,又有所區別: 

  2. 例如有一張表,如下所示: 

  3. mysql> CREATE TABLE t1 (first_name VARCHAR(10), last_name VARCHAR(10)); 
  4. Query OK, 0 rows affected (0.11 sec) 

  5. 假設這時候需要建一個full_name的索引,在Oracle中,我們可以直接在建立索引的時候使用函式,如下所示: 

  6. alter table t1 add index full_name_idx(CONCAT(first_name,' ',last_name)); 

  7. 但是,上面這條語句在MySQL中就會報錯。在MySQL中,我們可以先新建一個Generated Column,然後再在這個Generated Column上建索引,如下所示: 

  8. mysql> alter table t1 add column full_name VARCHAR(255) GENERATED ALWAYS AS (CONCAT(first_name,' ',last_name)); 

  9. mysql> alter table t1 add index full_name_idx(full_name); 

  10. 乍一看,MySQL需要在表上增加一列,才能夠實現類似Oracle的函式索引,似乎代價會高很多。但是,我們在第2部分說過,對於Virtual Generated Column,MySQL只是將這一列的元資訊儲存在資料字典中,並不會將這一列資料持久化到磁碟上,因此,在MySQL的Virtual Generated Column上建立索引和Oracle的函式索引類似,並不需要更多的代價,只是使用方式有點不一樣而已。 

  11. 參考資料 
  12. http://mysqlserverteam.com/json-labs-release-effective-functional-indexes-in-innodb/ 
  13. http://dev.mysql.com/doc/refman/5.7/en/create-table.html#create-table-generated-columns 
  14. http://mysqlserverteam.com/virtual-columns-and-effective-functional-indexes-in-innodb/

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/29096438/viewspace-1973687/,如需轉載,請註明出處,否則將追究法律責任。

相關文章