資料庫的使用你可能忽略了這些

it米粉發表於2019-02-26

原文網址 : https://flycode.co/archives/278674

資料庫的管理是一個非常專業的事情，對資料庫的調優、監控一般是由資料庫工程師完成，但是開發人員也經常與資料庫打交道，即使是簡單的增刪改查也是有很多竅門，這裡，一起來聊聊資料庫中很容易忽略的問題。

欄位長度省著點用

先說說我們常用的型別的儲存長度：

列型別	儲存長度
tinyint	1位元組
smallint	2位元組
int	4位元組
bigint	8位元組
float	4位元組
decimal(m,d)	0-4位元組
datetime	8位元組
timestamp	4位元組
char(m)	m個位元組
varchar(m)	可變長度
text	可變長度

很明顯，不同的型別儲存的長度有很大區別的，對查詢的效率有影響，欄位長度對索引的影響是很大的。

字串欄位長度都差不多的，可以預估長度的，用char
字串長度差異大，用varchar,限制長度，不要浪費空間
整型根據大小，選擇合適的型別
時間建議用timestamp
建議使用decimal，不建議使用float,如果是價格，可以考慮用int或bigint，如1元，儲存的就是100

放棄uuid(guid)的使用

不管是uuid，還是guid，使用的時候都是為了避免同時生成重複的ID，但是建議考慮其他方案，原因如下：

uuid沒有順序
uuid太長
uuid規則完全不可控

推薦的方案用bigint（首選），或者char來儲存，生成方式參考snowflake的演算法，有順序、長度固定、比uuid更短，當然，也幾乎不會重複。

大表減少聯表，最好是單表查詢

單表查詢的優勢很多，查詢效率極高，便於分表分庫擴充套件，但是很多時候大家都覺得真正實現起來不太現實，完全失去了關聯式資料庫的意義，但是單表的效能優勢太明顯，一般總會有辦法解決的:

合理的冗餘欄位
配合記憶體資料庫（redis\mongodb）使用
聯表變多次查詢（下文會有說明）

如果考慮都後期資料量大，需要分表分庫，就應該儘早實時單表查詢，現在的資料庫分表分庫的中介軟體基本都無法支援聯表查詢。即使如mycat最多支援兩個表的聯表查詢，但是也有很明顯的效能損耗。

索引的正確處理方式

索引的優勢這裡就不多說了，索引使用不當會有反效果：

資料量很小的表，不需要索引
一個表的索引不宜過多，建議最多就5個，索引不可能滿足所有的場景，但是了個滿足絕大部分的場景
mysql 和 sqlserver的索引差別還挺大的，需要注意。例如：
mysql索引欄位的順序對效能有很大影響，sqlserver優化過，影響很小

多查幾次比聯表可能要好

提出這個方案相信會得到很多人的反對，但是我相信這個結論還是非常適合資料量大的場景。多查幾次資料庫有這麼幾個弊端：

增加了網路消耗
增加了資料庫的連線數

其實，這兩個問題在現在基本都可以忽略的，資料庫和應用的連線基本都是內網，這個網路連線的效率還是很高的。資料庫對連線池的優化已經比較成熟了，連線數只要不是太多，影響也不會太嚴重，但是多查幾次的優勢卻很多：

單表效率更高
便於後期擴充套件分表分庫庫
有效利用資料庫本身的結果快取
減少鎖表，聯表會鎖多個表

當然，多查幾次這個度一定要把握。千萬不要在一個迴圈裡面查詢資料庫。我們也應該儘量減少查詢資料庫的次數。我們可以接受1次查詢變2次查詢，如果你變成10次查詢，那就要放棄了。
舉個例子：
查詢商品的時候，需要顯示分類表的分類名

select category.name,product.name from product  inner join category on p.categoryid=category.id複製程式碼

建議的方式：

select categoryid,name  from product 
select categoryname from category where categoryid in ('','','','')複製程式碼

當然，你可以再優化一下，查詢分類名之前，對product的categoryid排序一下，這樣速度更快。因為我們前面已經用snowflake生成了有順序的主鍵了。
補充一下，in的效率並不是你想象的那麼慢，如果保持在100個節點（很多書籍介紹1000個節點，我們保守一點），效能還是很高的。

儘量使用簡單的資料庫指令碼

很多用過 .net Entity Framework 的人都說這個框架太慢，其實慢主要是兩點：錯誤的使用延遲載入（外來鍵關聯）、生成SQL編譯太慢。Entity Framework生成的SQL指令碼有太多沒用的東西，導致編譯太慢。
資料庫指令碼儘量使用簡單的，不要用太長的一個SQL指令碼，會導致初次執行的時候，編譯SQL指令碼花費太多的時間。

儘量去避免聚合操作

聚合操作如count,group等，是資料庫效能的大殺手，經常會出現大面積的表掃描和索表的情況，所以大家能看到很多平臺都把數量的計算給隱藏了，商品查詢不去實時顯示count的結果。如淘寶，就不顯示查詢結果的數量，只是顯示前100頁。
避免聚合操作的方法就是將實時的count計算結果用欄位去儲存，去累加這個結果。當然，也可以考慮用spark等實時計算框架去處理，這種高深的技術，不在此次討論範圍內。（PS:主要是我也不懂）

總結

程式的優化很多時候都是一些細節的問題，更應該注意平時的積累，阿里SQL的規範有很多可以吸取的地方，以上也是自己工作中的一些總結。
（完）

歡迎大家關注我的公眾號交流、學習、第一時間獲取最新的文章。
微訊號：itmifen

在Flutter中使用SetState無效？可能是忽略了這個！
2020-06-20
Flutter
文字資料預處理:可能需要關注這些點
2023-01-31
資料庫的這些效能優化，你做了嗎？
2018-08-22
資料庫優化
Redis 命令列工具能這樣用你知道了嗎？
2018-10-24
Redis命令列
這些簡單的技巧使 VLC 更加出色
2020-01-13
「資料庫、資料庫連線池、資料來源」這些概念你真的理解了嗎？
2023-04-22
資料庫
如何使資料庫中取出的資料保持原有格式(轉)
2019-04-06
資料庫
這些著名資料庫之間的“關係”，你知道嗎？
2020-09-16
資料庫
資料庫的基本資訊，都在這幾張表裡了
2022-03-16
資料庫
python 資料探勘-我分析了《乘風破浪的姐姐》，發現了這些秘密
2020-06-26
Python
mybatis oracle資料庫批次插入資料，忽略主鍵重複
2024-03-14
MyBatisOracle資料庫
為了讓你搞定資料庫選型，這些工程師重寫了 26 萬行程式碼
2021-10-11
資料庫工程師行程
你可能忽略的多型問題
2018-08-12
多型
深入理解MySQL---資料庫知識最全整理，這些你都知道了嗎？
2021-09-09
MySql資料庫
python 資料探勘-我分析了《乘風破浪的姐姐》，發現了這些祕密
2020-06-26
Python
學會這些 Web API 使你的開發效率翻倍
2023-04-10
WebAPI
[這可能是最好的Spring教程！]JDBC中資料庫的連線與查詢
2024-11-15
SpringJDBC資料庫
你可能忽略的js型別轉換
2018-05-25
JS型別
可能被忽略的"按鈕元件"細節
2019-01-30
元件
你可能會忽略的 Git 提交規範
2019-03-17
Git
這可能是實現高斯模糊（毛玻璃）最簡單的庫了
2018-03-28
製作自媒體短影片，這些內容不能忽略！
2021-08-26
Flink State 有可能代替資料庫嗎？
2019-11-21
資料庫
Java中的這些String特性可能需要了解下
2024-05-17
Java
你可能已經忽略的git commit規範
2020-10-20
GitMIT
.gitignore 在已忽略資料夾中不忽略指定檔案、資料夾...
2019-05-30
Git
MySQL 8.0 在關聯式資料庫方面有這些新特性
2018-05-14
MySql資料庫
【恩墨學院】原來銀行都在用這些資料庫
2018-03-30
資料庫
資料庫資料恢復-ORACLE資料庫的常見故障&各種故障下的資料恢復可能性
2023-09-18
資料庫資料恢復Oracle
MySQL資料庫SYS CPU高的可能性分析
2020-09-30
MySql資料庫
儘可能地恢復織夢CMS的資料庫
2024-10-08
資料庫
轉行程式設計師？你可能忽略了一件事。
2018-11-01
行程程式設計師
在個稅App上填資料遇到的這些問題，權威解答來了
2019-01-10
APP
資料庫日常管理 ? 我有這些經驗淺談交給你
2018-07-17
資料庫
亞信安慧AntDB探索資料庫更多可能
2024-02-01
資料庫
幹掉 PowerDesigner，這款資料庫設計神器真的絕了！！！
2022-01-25
資料庫
這可能是vue-cli最全的解析了……
2018-06-19
Vue
資料庫簡單的一些原理概念
2022-03-23
資料庫