MySQL全面瓦解26：程式碼評審中的MySQL（團隊使用）

翁智華發表於2021-07-22

原文網址 : https://www.cnblogs.com/wzh2010/p/15027366.html

資料庫物件命名規範

資料庫物件

資料庫物件是資料庫的組成部分，常見的有以下幾種：表（Table ）、索引（Index）、檢視（View）、圖表（Diagram）、預設值（Default）、規則（Rule）、觸發器（Trigger）、儲存過程（Stored Procedure）、使用者（User）等。命名規範是指資料庫物件如資料庫（SCHEMA）、表（TABLE）、索引（INDEX）、約束（CONSTRAINTS）等的命名約定。

資料庫物件全域性命名規範

1、命名使用具有意義的英文詞彙，詞彙中間以下劃線分隔

2、命名只能使用英文字母、數字、下劃線，以英文字母開頭

3、避免用MySQL的保留字如：backup、call、group等，參考MySQL 5.7+的關鍵字和保留字。

4、所有資料庫物件使用小寫字母，實際上MySQL中是可以設定大小寫是否敏感的，為了保證統一性，我們這邊規範全部小寫表示。

資料庫命名規範

1、資料庫命名儘量不超過30個字元。

2、資料庫命名一般為專案名稱+代表庫含義的簡寫，比如IM專案的工作流資料庫，可以是 im_flow。

3、資料庫建立時必須新增預設字符集和校對規則子句。預設字符集為UTF8（已遷移dumbo的使用utf8mb4）

4、命名應使用小寫。

表命名規範

1、常規表表名以t_開頭，t代表table的意思，命名規則即 t + 模組（包含模組含義的簡寫）+ 表（包含表含義的簡寫），比如使用者模組的教育資訊表：t_user_eduinfo。

2、臨時表（RD、QA或DBA同學用於資料臨時處理的表），命名規則：temp字首+模組+表+日期字尾：temp_user_eduinfo_20210719

3、備份表（用於儲存和歸檔歷史資料或者作為災備恢復的資料）命名規則，bak字首+模組+表+日期字尾：bak_user_eduinfo_20210719

4、同一個模組的表儘可能使用相同的字首，表名稱儘可能表達含義

5、多個單詞以下劃線 _ 分隔

6、常規表表名儘量不超過30個字元，temp表和bak表視情況而定，也儘量簡短為宜，命名應使用小寫

欄位命名規範

1、欄位命名需要表示其實際含義的英文單詞或簡寫，單詞之間用下劃線 _ 進行連線，如 service_ip、service_port。

2、各表之間相同意義的欄位必須同名，比如a表和b表都有建立時間，應該統一為create_time，不一致會很混亂。

3、多個單詞以下劃線 _ 分隔

4、欄位名儘量不超過30個字元，命名應該使用小寫

索引命名規範

1、唯一索引使用uni + 欄位名來命名： create unique index uni_uid on t_user_basic(uid) 。

2、非唯一索引使用idx + 欄位名來命名： create index idx_uname_mobile on t_user_basic(uname,mobile) 。

3、多個單詞以下劃線 _ 分隔。

4、索引名儘量不超過50個字元，命名應該使用小寫，組合索引的欄位不宜太多，不然也不利於查詢效率的提升。

5、多單片語成的列名，取儘可能代表意義的縮寫，如 test_contact表member_id和friend_id上的組合索引：idx_mid_fid。

6、理解組合索引最左字首原則，避免重複建設索引，如果建立了(a,b,c)，相當於建立了(a), (a,b), (a,b,c)。

檢視命名規範

1、檢視名以v開頭，表示view，完整結構是v+檢視內容含義縮寫。

2、如果檢視只來源單個表，則為v+表名。如果檢視由幾個表關聯產生就用v+下劃線（_）連線幾個表名，檢視名儘量不超過30個字元。如超過30個字元則取簡寫。

3、如無特殊需要，嚴禁開發人員建立檢視。

4、命名應使用小寫。

儲存過程命名規範

1、儲存過程名以sp開頭，表示儲存過程（storage procedure）。之後多個單詞以下劃線（_）進行連線。儲存過程命名中應體現其功能。儲存過程名儘量不能超過30個字元。

2、儲存過程中的輸入引數以i_開頭，輸出引數以o_開頭。

3、命名應使用小寫。

1 create procedure sp_multi_param(in i_id bigint,in i_name varchar(32),out o_memo varchar(100))

函式命名規範

1、函式名以func開始，表示function。之後多個單詞以下劃線（_）進行連線，函式命名中應體現其功能。函式名儘量不超過30個字元。

2、命名應使用小寫。

1 create function func_format_date(ctime datetime)

觸發器命名規範

1、觸發器以trig開頭，表示trigger 觸發器。

2、基本部分，描述觸發器所加的表，觸發器名儘量不超過30個字元。

3、字尾（_i,_u,_d）,表示觸發條件的觸發方式（insert,update或delete）。

4、命名應使用小寫。

1 DROP TRIGGER IF EXISTS trig_attach_log_d;
2 CREATE TRIGGER trig_attach_log_d AFTER DELETE ON t_dept FOR EACH ROW;

約束命名規範

1、唯一約束：uk_表名稱_欄位名。uk是UNIQUE KEY的縮寫。比如給一個部門的部門名稱加上唯一約束，來保證不重名，如下：ALTER TABLE t_dept ADD CONSTRAINT un_name UNIQUE(name);

2、外來鍵約束：fk_表名，後面緊跟該外來鍵所在的表名和對應的主表名（不含t_）。子表名和父表名用下劃線(_)分隔。如下： ALTER TABLE t_user ADD CONSTRAINT fk_user_dept FOREIGN KEY(depno) REFERENCES t_dept (id);

3、非空約束：如無特殊需要，建議所有欄位預設非空(not null)，不同資料型別必須給出預設值(default)。

1 `id` int(11) NOT NULL,
2 `name` varchar(30) DEFAULT '',
3 `deptId` int(11) DEFAULT 0,
4 `salary` float DEFAULT NULL,

4、出於效能考慮，如無特殊需要，建議不使用外來鍵。參照完整性由程式碼控制。這個也是我們普遍的做法，從程式角度進行完整性控制，但是如果不注意，也會產生髒資料。

5、命名應使用小寫。

使用者命名規範

1、生產使用的使用者命名格式為 code_應用

2、只讀使用者命名規則為 read_應用

資料庫物件設計規範

儲存引擎的選擇

1、如無特殊需求，必須使用innodb儲存引擎。

可以通過 show variables like 'default_storage_engine' 來檢視當前預設引擎。主要有MyISAM 和 InnoDB，從5.5版本開始預設使用 InnoDB 引擎。

基本的差別為：MyISAM型別不支援事務處理等高階處理，而InnoDB型別支援。MyISAM型別的表強調的是效能，其執行速度比InnoDB型別更快，但是不提供事務支援，而InnoDB提供事務支援以及外部鍵等高階資料庫功能。

字符集的選擇

1、如無特殊要求，必須使用utf8或utf8mb4。

在國內，選擇對中文和各語言支援都非常完善的utf8格式是最好的方式，MySQL在5.5之後增加utf8mb4編碼，mb4就是most bytes 4的意思，專門用來相容四位元組的unicode。

所以utf8mb4是utf8的超集，除了將編碼改為utf8mb4外不需要做其他轉換。當然，為了節省空間，一般情況下使用utf8也就夠了。

可以使用如下指令碼來檢視資料庫的編碼格式

1 SHOW VARIABLES WHERE Variable_name LIKE 'character_set_%' OR Variable_name LIKE 'collation%';
2 -- 或
3 SHOW VARIABLES Like '%char%';

表設計規範

1、不同應用間所對應的資料庫表之間的關聯應儘可能減少，不允許使用外來鍵對錶之間進行關聯，確保元件對應的表之間的獨立性，為系統或表結構的重構提供可能性。目前業內的做法一般由程式控制參照完整性。

2、表設計的角度不應該針對整個系統進行資料庫設計，而應該根據系統架構中元件劃分，針對每個元件所處理的業務進行資料庫設計。

3、表必須要有PK，主鍵的優勢是唯一標識、有效引用、高效檢索，所以一般情況下儘量有主鍵欄位。

4、一個欄位只表示一個含義。

5、表不應該有重複列。

6、禁止使用複雜資料型別(陣列,自定義等)，Json型別的使用視情況而定。

7、需要join的欄位(連線鍵)，資料型別必須保持絕對一致，避免隱式轉換。比如關聯的欄位都是int型別。

8、設計應至少滿足第三正規化,儘量減少資料冗餘。一些特殊場景允許反正規化化設計，但在專案評審時需要對冗餘欄位的設計給出解釋。

9、TEXT欄位作為大體量文字儲存，必須放在獨立的表中 , 用PK與主表關聯。如無特殊需要，禁止使用TEXT、BLOB欄位。

10、需要定期刪除(或者轉移)過期資料的表，通過分表解決，我們的做法是按照2/8法則將操作頻率較低的歷史資料遷移到歷史表中，按照時間或者則曾Id做切割點。

11、單表欄位數不要太多，建議最多不要大於50個。過度的寬表對效能也是很大的影響。

12、MySQL在處理大表時，效能就開始明顯降低，所以建議單表物理大小限制在16GB，表中資料行數控制在2000W內。

業內的規則是超過2000W效能開始明顯降低。但是這個值是靈活的，你可以根據實際情況進行測試來判斷，比如阿里的標準就是500W，百度的確是2000W。實際上是否寬表，單行資料所佔用的空間都有起到作用的。

13、如果資料量或資料增長在前期規劃時就較大，那麼在設計評審時就應加入分表策略，後續會有專門的文章來分析資料拆分的做法：垂直拆分（垂直分庫和垂直分表）、水平拆分（分庫分表和庫內分表）；

14、無特殊需求，嚴禁使用分割槽表

欄位設計規範

1、INT：如無特殊需要，存放整型數字使用UNSIGNED INT型，整型欄位後的數字代表顯示長度。比如 `id` int(11) NOT NULL

2、DATETIME：所有需要精確到時間(時分秒)的欄位均使用DATETIME,不要使用TIMESTAMP型別。

對於TIMESTAMP，它把寫入的時間從當前時區轉化為UTC（世界標準時間）進行儲存。查詢時，將其又轉化為客戶端當前時區進行返回。而對於DATETIME，不做任何改變，基本上是原樣輸入和輸出。

另外DATETIME儲存的範圍也比較大：

timestamp所能儲存的時間範圍為：'1970-01-01 00:00:01.000000' 到 '2038-01-19 03:14:07.999999'。

datetime所能儲存的時間範圍為：'1000-01-01 00:00:00.000000' 到 '9999-12-31 23:59:59.999999'。

但是特殊情況，對於跨時區的業務，TIMESTAMP更為合適。

3、VARCHAR：所有動態長度字串全部使用VARCHAR型別,類似於狀態等有限類別的欄位,也使用可以比較明顯表示出實際意義的字串,而不應該使用INT之類的數字來代替；VARCHAR(N)，

N表示的是字元數而不是位元組數。比如VARCHAR(255)，可以最大可儲存255個字元（字元包括英文字母，漢字，特殊字元等）。但N應儘可能小，因為MySQL一個表中所有的VARCHAR欄位最大長度是65535個位元組，且儲存字元個數由所選字符集決定。

如UTF8儲存一個字元最大要3個位元組，那麼varchar在存放佔用3個位元組長度的字元時不應超過21845個字元。同時，在進行排序和建立臨時表一類的記憶體操作時，會使用N的長度申請記憶體。(如無特殊需要，原則上單個varchar型欄位不允許超過255個字元)

4、TEXT：僅僅當字元數量可能超過20000個的時候,才可以使用TEXT型別來存放字元類資料,因為所有MySQL資料庫都會使用UTF8字符集。

所有使用TEXT型別的欄位必須和原表進行分拆，與原表主鍵單獨組成另外一個表進行存放，與大文字欄位的隔離，目的是。如無特殊需要，不使用MEDIUMTEXT、TEXT、LONGTEXT型別

5、對於精確浮點型資料儲存，需要使用DECIMAL，嚴禁使用FLOAT和DOUBLE。

6、如無特殊需要，儘量不使用BLOB型別

7、如無特殊需要，欄位建議使用NOT NULL屬性，可用預設值代替NULL

8、自增欄位型別必須是整型且必須為UNSIGNED，推薦型別為INT或BIGINT，並且自增欄位必須是主鍵或者主鍵的一部分。

索引設計規範

建議學習索引設計規範跟之前先看本人的的另外一篇文章，都是索引的使用策略

1、索引區分度

索引必須建立在索引選擇性（區分度）較高的列上，選擇性的計算方式為: selecttivity = count(distinct c_name)/count(*) ; 如果區分度結果小於0.2，則不建議在此列上建立索引，否則大概率會拖慢SQL執行

2、遵循最左字首

對於確定需要組成組合索引的多個欄位，設計時建議將選擇性高的欄位靠前放。使用時，組合索引的首欄位，必須在where條件中，且需要按照最左字首規則去匹配。

3、禁止使用外來鍵，可以在程式級別來約束完整性

4、Text型別欄位如果需要建立索引，必須使用字首索引

5、單張表的索引數量理論上應控制在5個以內。經常有大批量插入、更新操作表，應儘量少建索引，索引建立的原則理論上是多讀少寫的場景。

6、ORDER BY，GROUP BY，DISTINCT的欄位需要新增在索引的後面，形成覆蓋索引

7、正確理解和計算索引欄位的區分度，文中有計算規則，區分度高的索引，可以快速得定位資料，區分度太低，無法有效的利用索引，可能需要掃描大量資料頁，和不使用索引沒什麼差別。

8、正確理解和計算字首索引的欄位長度，文中有判斷規則，合適的長度要保證高的區分度和最恰當的索引儲存容量，只有達到最佳狀態，才是保證高效率的索引。

9、聯合索引注意最左匹配原則：必須按照從左到右的順序匹配，MySQL會一直向右匹配索引直到遇到範圍查詢(>、<、between、like)然後停止匹配。

如：depno=1 and empname>'' and job=1 如果建立(depno,empname,job)順序的索引，job是用不到索引的。

10、應需而取策略，查詢記錄的時候，不要一上來就使用*，只取需要的資料，可能的話儘量只利用索引覆蓋，可以減少回表操作，提升效率。

11、正確判斷是否使用聯合索引（上面聯合索引的使用那一小節有說明判斷規則），也可以進一步分析到索引下推（IPC），減少回表操作，提升效率。

12、避免索引失效的原則：禁止對索引欄位使用函式、運算子操作，會使索引失效。這是實際上就是需要保證索引所對應欄位的”乾淨度“。

13、避免非必要的型別轉換，字串欄位使用數值進行比較的時候會導致索引無效。

14、模糊查詢'%value%'會使索引無效，變為全表掃描，因為無法判斷掃描的區間，但是'value%'是可以有效利用索引。

15、索引覆蓋排序欄位，這樣可以減少排序步驟，提升查詢效率

16、儘量的擴充套件索引，非必要不新建索引。比如表中已經有a的索引，現在要加(a,b)的索引，那麼只需要修改原來的索引即可。

約束設計規範

1、PK應該是有序並且無意義的，由開發人員自定義，儘可能簡短，並且是自增序列。

2、表中除PK以外,還存在唯一性約束的,可以在資料庫中建立以“uk_”作為字首的唯一約束索引。

3、PK欄位不允許更新。

4、禁止建立外來鍵約束，外來鍵約束由程式控制。

5、如無特殊需要，所有欄位必須新增非空約束，即not null。

6、如無特殊需要，所有欄位必須有預設值。

SQL使用規範

select 檢索的規範性

1、儘量避免使用select *，join語句使用select * 可能導致只需要訪問索引即可完成的查詢需要回表取數。

一種是可能取出很多不需要的資料，對於寬表來說，這是災難；一種是儘可能避免回表，因為取一些根本不需要的資料而回表導致效能低下，是很不合算。

2、嚴禁使用 select * from t_name ，而不加任何where條件，道理一樣，這樣會變成全表全欄位掃描。

3、MySQL中的text型別欄位儲存：

3.1、不與其他普通欄位存放在一起,因為讀取效率低，也會影響其他輕量欄位存取效率。

3.2、如果不需要text型別欄位，又使用了select *，會讓該執行消耗大量io，效率也很低下

4、在取出欄位上可以使用相關函式，但應儘可能避免出現 now() , rand() , sysdate() 等不確定結果的函式，在Where條件中的過濾條件欄位上嚴禁使用任何函式，包括資料型別轉換函式。大量的計算和轉換會造成效率低下，這個在索引那邊也描述過了。

5、分頁查詢語句全部都需要帶有排序條件 , 否則很容易引起亂序

6、用in()/union替換or，效率會好一些，並注意in的個數小於300

7、嚴禁使用%字首進行模糊字首查詢:如： select a,b,c from t_name where a like ‘%name’; 可以使用%模糊字尾查詢如： select a,b from t_name where a like ‘name%’;

8、避免使用子查詢，可以把子查詢優化為join操作

通常子查詢在in子句中，且子查詢中為簡單SQL(不包含union、group by、order by、limit從句)時，才可以把子查詢轉化為關聯查詢進行優化。

子查詢效能差的原因：

· 子查詢的結果集無法使用索引，通常子查詢的結果集會被儲存到臨時表中，不論是記憶體臨時表還是磁碟臨時表都不會存在索引，所以查詢效能會受到一定的影響；

· 特別是對於返回結果集比較大的子查詢，其對查詢效能的影響也就越大；

· 由於子查詢會產生大量的臨時表也沒有索引，所以會消耗過多的CPU和IO資源，產生大量的慢查詢。

操作的規範性

1、禁止使用不含欄位列表的INSERT語句

如： insert into values ('a','b','c'); 應使用 insert into t_name(c1,c2,c3) values ('a','b','c'); 。

2、大批量寫操作（UPDATE、DELETE、INSERT），需要分批多次進行操作

· 大批量操作可能會造成嚴重的主從延遲，特別是主從模式下，大批量操作可能會造成嚴重的主從延遲，因為需要slave從master的binlog中讀取日誌來進行資料同步。

· binlog日誌為row格式時會產生大量的日誌

程式上的約束

後續我們團隊的目標是研發工具對開發同學提交的建庫、建表、刷資料、查詢的語句進行分析，看看是否符合應有的規範。如果不符合，駁回修改。

MySQL全面瓦解23：MySQL索引實現和使用
2021-02-25
MySql索引
【團隊建設】如何做好團隊開發中的 CodeReview（程式碼評審）？
2024-08-19
View
前端團隊程式碼評審 CheckList 清單
2019-07-03
前端
MySQL全面瓦解15：檢視
2020-12-30
MySql
MySQL全面瓦解14：事務
2020-12-16
MySql
MySQL全面瓦解6：查詢的基本操作
2020-11-06
MySql
MySQL全面瓦解4：資料定義-DDL
2020-10-30
MySql
MySQL全面瓦解5：資料操作-DML
2020-11-01
MySql
MySQL全面瓦解28：分庫分表
2021-12-02
MySql
MySQL全面瓦解19：遊標相關
2021-01-21
MySql
MySQL全面瓦解18：自定義函式
2021-01-20
MySql函式
MySQL全面瓦解8：查詢的正則匹配
2020-11-10
MySql
MySQL全面瓦解：安裝部署與準備
2020-10-26
MySql
MySQL全面瓦解17：觸發器相關
2021-01-19
MySql觸發器
MySQL全面瓦解7：查詢的過濾條件
2020-11-09
MySql
MySQL全面瓦解22：索引的介紹和原理分析
2021-02-18
MySql索引
MySQL全面瓦解29：使用Partition功能實現水平分割槽
2021-12-07
MySql
MySQL全面瓦解16：儲存過程相關
2021-01-18
MySql儲存過程
MySQL全面瓦解13：系統函式相關
2020-11-28
MySql函式
MySQL全面瓦解9：查詢的排序、分頁相關
2020-11-13
MySql排序
MySQL全面瓦解27：主從複製（原理 + 實踐）
2021-08-17
MySql
MySQL全面瓦解20：可程式設計性之流程控制語句
2021-01-22
MySql程式設計
MySQL全面瓦解12：連線查詢的原理和應用
2020-11-19
MySql
MySQL全面瓦解10：分組查詢和聚合函式
2020-11-16
MySql函式
MySQL全面瓦解3：資料型別介紹與分析
2020-10-28
MySql資料型別
MySQL全面瓦解2：常用命令和系統管理
2020-10-27
MySql
MySQL全面瓦解11：子查詢和組合查詢
2020-11-17
MySql
離開MySQL團隊的感想 - Steinar
2021-12-06
MySql
MySQL全面瓦解25：構建高效能索引（案例分析篇）
2021-03-09
MySql索引
淺談軟體工程中的程式碼評審
2018-10-14
軟體工程
說透程式碼評審
2020-07-15
程式碼審查或評審的最佳實踐 - FogBugz
2019-07-13
[譯] 程式碼評審的 8 點建議
2018-10-25
MySQL審計audit
2021-01-10
MySql
程式碼評審的不可能三角
2018-09-25
程式碼評審的18個軍規，收藏好！
2023-05-04
Google程式碼評審介紹 - Michaela Greiler
2019-08-07
Go
閒談團隊的程式碼質量
2019-03-01

MySQL全面瓦解26：程式碼評審中的MySQL（團隊使用）

資料庫物件命名規範

資料庫物件

資料庫物件全域性命名規範

資料庫命名規範

表命名規範

欄位命名規範

索引命名規範

檢視命名規範

儲存過程命名規範

函式命名規範

觸發器命名規範

約束命名規範

使用者命名規範

資料庫物件設計規範

儲存引擎的選擇

字符集的選擇

表設計規範

欄位設計規範

索引設計規範

約束設計規範

SQL使用規範

select 檢索的規範性

操作的規範性

程式上的約束

相關文章