必看的資料庫使用規範

kun_jian發表於2019-05-27

導讀:

關於MySQL資料庫規範,相信大家多少看過一些文件。本篇文章給大家詳細分類總結了資料庫相關規範,從庫表命名設計規範講起,到索引設計規範,後面又給出SQL編寫方面的建議。相信這些規範適用於大多數公司,也希望大家都能按照規範來使用我們的資料庫,這樣我們的資料庫才能發揮出更高的效能。

關於庫:

  1. 【強制】庫的名稱必須控制在32個字元以內,英文一律小寫。
  2. 【強制】庫的名稱格式:業務系統名稱_子系統名。
  3. 【強制】庫名只能使用英文字母,數字,下劃線,並以英文字母開頭。
  4. 【強制】建立資料庫時必須顯式指定字符集,並且字符集只能是utf8或者utf8mb4。建立資料庫SQL舉例:Create database db1 default character set utf8;
  5. 【建議】臨時庫、表名以tmp_ 為字首,並以日期為字尾,備份庫、表以 bak_ 為字首,並以日期為字尾。

關於表

  1. 【強制】表和列的名稱必須控制在32個字元以內,表名只能使用字母、數字和下劃線,一律小寫。

  2. 【強制】表名要求模組名強相關,同一模組使用的表名儘量使用統一字首。

  3. 【強制】建立表時必須顯式指定字符集為utf8或utf8mb4。

  4. 【強制】列名儘量不用關鍵字(如type,order等)。

  5. 【強制】建立表時必須顯式指定表儲存引擎型別,如無特殊需求,一律為InnoDB。

  6. 【強制】建表必須有comment。

  7. 【強制】對於超過100W行的大表進行alter table,必須經過DBA稽核,並在業務低峰期執行,多個alter需整合在一起。 因為alter table會產生表鎖,期間阻塞對於該表的所有寫入,對於業務可能會產生極大影響。

  8. 【建議】建表時關於主鍵:表必須有主鍵 (1)強制要求主鍵為id,型別為int或bigint,且為auto_increment 建議使用unsigned無符號型。

    (2)標識表裡每一行主體的欄位不要設為主鍵,建議設為其他欄位如user_id,order_id等,並建立unique key索引。 因為如果設為主鍵且主鍵值為隨機插入,則會導致innodb內部page分裂和大量隨機I/O,效能下降。

  9. 【建議】核心表(如使用者表)必須有行資料的建立時間欄位create_time和最後更新時間欄位update_time,便於查問題。

  10. 【建議】表中所有欄位儘量都是NOT NULL屬性,業務可以根據需要定義DEFAULT值。 因為使用NULL值會存在每一行都會佔用額外儲存空間、資料遷移容易出錯、聚合函式計算結果偏差等問題。

  11. 【建議】中間表用於保留中間結果集,名稱必須以tmp_ 開頭。備份表用於備份或抓取源錶快照,名稱必須以bak_開頭。中間表和備份表定期清理。

  12. 【示範】一個較為規範的建表語句:

    CREATE TABLE user_info (
      `id` int unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
      `user_id` bigint(11) NOT NULL COMMENT '使用者id',
      `username` varchar(45) NOT NULL COMMENT '真實姓名',
      `email` varchar(30) NOT NULL COMMENT '使用者郵箱',
      `nickname` varchar(45) NOT NULL COMMENT '暱稱',
      `birthday` date NOT NULL COMMENT '生日',
      `sex` tinyint(4) DEFAULT '0' COMMENT '性別',
      `short_introduce` varchar(150) DEFAULT NULL COMMENT '一句話介紹自己,最多50個漢字',
      `user_resume` varchar(300) NOT NULL COMMENT '使用者提交的簡歷存放地址',
      `user_register_ip` int NOT NULL COMMENT '使用者註冊時的源ip',
      `create_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '建立時間',
      `update_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '修改時間',
      `user_review_status` tinyint NOT NULL COMMENT '使用者資料稽核狀態,1為通過,2為稽核中,3為未通過,4為還未提交稽核',
      PRIMARY KEY (`id`),
      UNIQUE KEY `uniq_user_id` (`user_id`),
      KEY `idx_username`(`username`),
      KEY `idx_create_time_status`(`create_time`,`user_review_status`)
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='網站使用者基本資訊'
    複製程式碼

關於索引

  1. 【強制】InnoDB表必須主鍵為id int/bigint auto_increment,且主鍵值禁止被更新。
  2. 【強制】InnoDB和MyISAM儲存引擎表,索引型別必須為BTREE。
  3. 【建議】主鍵的名稱以 pk_ 開頭,唯一鍵以 uniq_uk_ 開頭,普通索引以 idx_ 開頭,一律使用小寫格式,以欄位的名稱或縮寫作為字尾。
  4. 【建議】單個表上的索引個數不能超過8個。
  5. 【建議】在建立索引時,多考慮建立聯合索引,並把區分度最高的欄位放在最前面。如列userid的區分度可由select count(distinct userid)計算出來。
  6. 【建議】在多表join的SQL裡,保證被驅動表的連線列上有索引,這樣join執行效率最高。
  7. 【建議】建表或加索引時,保證表裡互相不存在冗餘索引。 對於MySQL來說,如果表裡已經存在key(a,b),則key(a)為冗餘索引,需要刪除。

SQL編寫

  1. 【強制】程式端SELECT語句必須指定具體欄位名稱,禁止寫成 *。
  2. 【強制】程式端insert語句指定具體欄位名稱,不要寫成insert into t1 values(…)。
  3. 【強制】除靜態表或小表(100行以內),DML語句必須有where條件,且使用索引查詢。
  4. 【強制】where條件裡等號左右欄位型別必須一致,否則無法利用索引。
  5. 【強制】WHERE 子句中禁止只使用全模糊的LIKE條件進行查詢,必須有其他等值或範圍查詢條件,否則無法利用索引。
  6. 【強制】索引列不要使用函式或表示式,否則無法利用索引。如where length(name)='Admin'或where user_id+2=10023。
  7. 【建議】insert into…values(XX),(XX),(XX).. 這裡XX的值不要超過5000個。 值過多雖然上線很很快,但會引起主從同步延遲。
  8. 【建議】SELECT語句不要使用UNION,推薦使用UNION ALL,並且UNION子句個數限制在5個以內。 因為union all不需要去重,節省資料庫資源,提高效能。
  9. 【強制】禁止跨db的join語句。
  10. 【建議】不建議使用子查詢,建議將子查詢SQL拆開結合程式多次查詢,或使用join來代替子查詢。
  11. 【建議】線上環境,多表join不要超過5個表。
  12. 【建議】在多表join中,儘量選取結果集較小的表作為驅動表,來join其他表。
  13. 【建議】批量運算元據時,需要控制事務處理間隔時間,進行必要的sleep。
  14. 建議】事務裡包含SQL不超過5個 因為過長的事務會導致鎖資料較久,MySQL內部快取、連線消耗過多等問題。
  15. 【建議】事務裡更新語句儘量基於主鍵或unique key,如update … where id=XX; 否則會產生間隙鎖,內部擴大鎖定範圍,導致系統效能下降,產生死鎖。
  16. 【建議】減少使用order by,和業務溝通能不排序就不排序,或將排序放到程式端去做。Order by、group by、distinct這些語句較為耗費CPU,資料庫的CPU資源是極其寶貴的。
  17. 【建議】order by、group by、distinct這些SQL儘量利用索引直接檢索出排序好的資料。如where a=1 order by b可以利用key(a,b)。
  18. 【建議】包含了order by、group by、distinct這些查詢的語句,where條件過濾出來的結果集請保持在1000行以內,否則SQL會很慢。
    公眾號.jpg

相關文章