要慎用mysql的enum欄位的原因

duanhao發表於2021-09-09

PHP低階程式設計的兄弟是這樣來看這個問題的,我作下筆錄如下,期望能客觀的理解這個enum欄位的優點及缺點:

膘哥觀點:
    enum有優點。但個人覺得。。。缺點更多,客觀的講:優點主要是在建資料 庫的時候就可以把一些值給規範好。缺點是。。enum不適合PHP。主要是PHP是弱型別,如:你insert into ..... set a= 1,你沒法知道你是想 a= '1' 還是 a= 1(a='1'是插入值1,a=1是插入enum的第一個值,尤其php弱型別的,如果int的,很少有人在sql里加雙引號。),這是PHP和mysql 在使用enum 最大的問題。所以。。安心點啦。乾脆點直接tinyint。

單曲觀點:
    我覺得沒什麼優點,對數字型的enum,簡直就是夢魘,boolean  tinyint(1) 0,1 status  tinyint(1)  1,2,3,4,5,6..tinyint歡淫你~~。如:audit_result enum(1,2,3),set audit_result = 1;...容易出現膘哥所說的混淆。

簡單觀點:
   少用,一般都是用tinyint替代。

天楓觀點:
   我覺得除了狀態直觀  沒什麼優點,我一般直接int,tinyint([1or2or3]) 到底有啥區別?(後面會簡單探討下,這裡面的1or2or3區別。)

中庸觀點:
   a=1是插入enum的第一個值,尤其php弱型別的,如果int的,很少有人在sql里加雙引號,基本上是不加引號的。

豎琴螺觀點:
   六種情況就:tinyint(1)  -1,-2,1,2,3,4

上面各種觀點重點集中在PHP這種弱型別語言對引號不重視,程式設計師不寫容易引起插入的語句不是自己想要的結果的問題,容易出現int時沒有用引號導致插入了新值而不是定的那個值:

表結構如下: 

?

12345 CREATE TABLE `enum2tinyint` (  `switchs` enum('none','success','fail','delete','skip','1') DEFAULT NULL,  `switch` tinyint(1) NOT NULL,  KEY `switchs` (`switchs`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8

 
正常帶引號插入enum: 

?

12 INSERT INTO `test`.`enum2tinyint` (`switchs`, `switch`) VALUES ('1', '1'); 1 1

PHP的弱型別問題,特別是對int型別的情況,實踐如下: 
如果沒有帶引號插入enum欄位後如下(是第一個值none): 

?

12 INSERT INTO `test`.`enum2tinyint` (`switchs`, `switch`) VALUES (1, '1'); none 1

如果沒有帶引號插入enum欄位後如下(是第2個值success): 

?

12 INSERT INTO `test`.`enum2tinyint` (`switchs`, `switch`) VALUES (2, '1'); success 1


結論:要插入enum的值,欄位必須加引號,不加引號當然是數字,數字就是key,不是value。

規勸:
1)enum是整型這樣的錯誤很容易發生,尤其是php弱型別的,一般新來一個人,沒注意enum型別,就會犯錯。
2)資料庫說明清楚的話,或者可選擇的全是字串的話,還沒什麼,但是裡面有數字,難免有新手犯錯,養成加引號的習慣很重要。

最終結論:
歷史原因,要把enum改成tinyint程式改動太大了,用了的沒必要改·~,以後新建的時候,儘量使用tinyint就好。
這種欄位的重複內容過多的,索引建不建,關係不大,這種在mysql叫索引的勢太低,其查詢效果不太好:(英文是這麼翻譯的:)。
————————————————————————————————————————————————————————————————————
tinyint(1)和tinyint(4)一樣的,都是-127到128或者0到256。unsigned屬性全是正,和c語言unsigned int有點類似:
tinyint(1)   -128 ~ 127
tinyint(1) unsigned  0 ~ 255

為何表示的最大正數比最小負數的絕對值少1呢?
第一位是符號位,1表示負數
所以負數可以到128,正數只能到127
-128正127
如:0111 1111  正數  ,負數 1111 1111

提問:

Mysql裡int(1)和int(11)差別很大的,mysql的int,有個屬性 ,UNSIGNED ZEROFILL  後面的ZEROFILL,就是有定義的位數不夠則用零補齊對齊一下(這兒可能涉及到索引的效能罷):int,  長度(M)=5, 屬性=UNSIGNED ZEROFILL(無符號,用0來填充位數),00001,00002。

但這個tinyint呢,tinyint(1)和tinyint(4)一樣的?

看這文章後://

我估計:mysql這塊對一個位元組不像int這種四個位元組要進行對其前部分進行部分位元組索引,如果說tinyint(1)和tinyint(4)是一樣的表示範圍情況下,但mysql對tinyint數字長度位數作了可設定的限定,從理論上說其存在硬碟裡的位元組是不一樣才是合乎邏輯的,這塊估計還是為了對位元組進行對齊方便索引等,以提升效率為主罷,l如:ike keyword%    索引有效,如果統一對齊,索引效果會不會更好呢?我也只是猜測。
————————————————————————————————————————————————————————————————————

在網上找了下這個enum的mysql的大體實現如下:

一)enum的儲存原理我仔細檢視了下手冊。是這樣的:
在建立這個欄位時,我們會給他規定一個範圍比如enum('a','b','c'),這時mysql內部會建立一張hash結構的map表,類似:0000 -> a,0001 -> b,0002 -> c。
當我插入一條資料,此欄位的值位a或b或c時,他儲存在裡面的不是這個字元,而是對應他的索引,也就是那個0000或0001或0002。
同樣,enum在mysql手冊上的說明:
ENUM('value1','value2',...)
1或2個位元組,取決於列舉值的個數(最多65,535個值)
除非enum的個數超過了一定數量,否則他所佔的儲存空間也總是1位元組。

二)tinyint:
型別  位元組  最小值  最大值
      (帶符號的/無符號的)  (帶符號的/無符號的)
TINYINT  1  -128  127
他的最小儲存所佔空間也是1位元組。

最後,Enum,既然要用它,就不必要使用什麼0,1,2來代替實際的字串了。甚至中文字串。他並不會對資料庫效能進行多餘開銷。因為對於它來說,你使用'0','1','2'和'張三','李四','王五'資料表所佔的儲存空間一樣。但是考慮到我們實際應用時資料需要從db伺服器回傳到web app,所以在網路傳輸時,當然還是儘可能的傳輸小資料比較好。所以如果很在意這些,還是不用它好了。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/1343/viewspace-2810790/,如需轉載,請註明出處,否則將追究法律責任。

相關文章