MySQL的資料型別和建庫策略詳解

yantaicuiwei發表於2011-07-13
無論是在小得可憐的免費空間或是大型電子商務網站,合理的表結構、充分利用空間是十分必要的。這就要求我們對資料庫系統的常用有充分的認識。下面我就將我的一點心得寫出來跟大家分享。

一、數字型別。數字型別按照我的分類方法分為三類:整數類、小數類和數字類。

我所謂的“數字類”,就是指DECIMAL和NUMERIC,它們是同一種型別。它嚴格的說不是一種數字型別,因為他們實際上是將數字以字串形式儲存的;他的值的每一位(包括小數點)佔一個位元組的儲存空間,因此這種型別耗費空間比較大。但是它的一個突出的優點是小數的位數固定,在運算中不會“失真”,所以比較適合用於“價格”、“金額”這樣對精度要求不高但準確度要求非常高的欄位。

小數類,即浮點數型別,根據精度的不同,有FLOAT(單精度)和DOUBLE(雙精度)兩種。它們的優勢是精確度,FLOAT可以表示絕對值非常小、小到約 1.17E-38 (0.000...0117, 小數點後面有37個零)的小數,而DOUBLE更是可以表示絕對值小到約 2.22E-308 (0.000...0222, 小數點後面有307個零)的小數。FLOAT型別和DOUBLE型別佔用儲存空間分別是4位元組和8位元組。如果需要用到小數的欄位,精度要求不高的,當然用FLOAT了!可是說句實在話,我們“民用”的資料,哪有要求精度那麼高的呢?這兩種型別至今我沒有用過——我還沒有遇到適合於使用它們的事例。

用的最多的,最值得精打細算的,是整數型別。從只佔一個位元組儲存空間的TINYINT到佔8個位元組的BIGINT,挑選一個“夠用”並且佔用儲存空間最小的型別是設計資料庫時應該考慮的。TINYINT、SMALLINT、MEDIUMINT、INT和BIGINT佔用儲存空間分別為1位元組、2位元組、3位元組、4位元組和8位元組,就無符號的整數而言,這些型別能表示的最大整數分別為255、65535、16777215、4294967295和18446744073709551615。如果用來儲存使用者的年齡(舉例來說,資料庫中儲存年齡是不可取的),用TINYINT就夠了;九城的《縱橫》裡,各項技能值,用SMALLINT也夠了;如果要用作一個肯定不會超過16000000行的表的AUTO_INCREMENT的IDENTIFY欄位,當然用 MEDIUMINT 不用 INT ,試想,每行節約一個位元組,16000000行可以節約10兆多呢!

二、日期時間型別。

日期和時間型別比較簡單,無非是 DATE、TIME、DATETIME、TIMESTAMP和YEAR等幾個型別。只對日期敏感,而對時間沒有要求的欄位,就用DATE而不用DATETIME是不用說的了;單獨使用時間的情況也時有發生——使用TIME;但最多用到的還是用DATETIME。在日期時間型別上沒有什麼文章可做,這裡就不再詳述。

三、字元(串)型別。

不要以為字元型別就是 CHAR !CHAR和VARCHAR的區別在於CHAR是固定長度,只要你定義一個欄位是CHAR(10),那麼不論你儲存的資料是否達到了10個位元組,它都要佔去10個位元組的空間;而VARVHAR則是可變長度的,如果一個欄位可能的值是不固定長度的,我們只知道它不可能超過10個字元,把它定義為 VARCHAR(10)是最合算的,VARCHAR 型別的實際長度是它的值的(實際長度+1)。為什麼“+1”呢?這一個位元組用於儲存實際使用了多大的長度呀!從這個“+1”中也應該看到,如果一個欄位,它的可能值最長是10個字元,而多數情況下也就是用到了10個字元時,用VARCHAR就不合算了:因為在多數情況下,實際佔用空間是11個位元組,比用CHAR(10)還多佔用一個位元組!

舉個例子,就是一個儲存股票名稱和程式碼的表,股票名稱絕大部分是四個字的,即8個位元組;股票程式碼,上海的是六位數字,深圳的是四位數字。這些都是固定長度的,股票名稱當然要用 CHAR(8) ;股票程式碼雖然是不固定長度,但如果使用VARVHAR(6),一個深圳的股票程式碼實際佔用空間是5個位元組,而一個上海的股票程式碼要佔用7個位元組!考慮到上海的股票數目比深圳的多,那麼用VARCHAR(6)就不如CHAR(6)合算了。

雖然一個CHAR或VARVHAR的最大長度可以到255,我認為大於20的CHAR是幾乎用不到的——很少有大於20個位元組長度的固定長度的東東吧?不是固定長度的就用VARCHAR!大於100的VARCHAR也是幾乎用不到的——比這更大的用TEXT就好了。TINYTEXT,最大長度為255,佔用空間也是(實際長度+1);TEXT,最大長度65535,佔用空間是(實際長度+2);MEDIUMTEXT,最大長度16777215,佔用空間是(實際長度+3);LONGTEXT,最大長度4294967295,佔用空間是(實際長度+4)。為什麼“+1”?“+2”?“+3”?“+4”?你要是還不知道就該打PP了。這些可以用在論壇啊、新聞啊,什麼的,用來儲存文章的正文。根據實際情況的不同,選擇從小到大的不同型別。

四、列舉和集合型別。

列舉(ENUM)型別,最多可以定義65535種不同的字串從中做出選擇,只能並且必須選擇其中一種,佔用儲存空間是一個或兩個位元組,由列舉值的數目決定;集合(SET)型別,最多可以有64個成員,可以選擇其中的零個到不限定的多個,佔用儲存空間是一個到八個位元組,由集合可能的成員數目決定。

舉個例子來說,在SQLServer中,你可以節約到用一個Bit型別來表示性別(男/女),但MySQL沒有Bit,用TINTINT?不,可以用ENUM('帥哥','美眉')!只有兩種選擇,所以只需一個位元組——跟TINYINT一樣大,但卻可以直接用字串'帥哥'和'美眉'來存取。真是太方便啦!

http://space.itpub.net/14884316/viewspace-409992

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/21601207/viewspace-702116/,如需轉載,請註明出處,否則將追究法律責任。

相關文章