關於如何形成一個好的資料庫設計

xianggao發表於2016-01-06

　　如果你正在負責一個基於SQL Server的專案，或者你剛剛接觸SQL Server，你都有可能要面臨一些資料庫效能的問題，這篇文章會為你提供一些有用的指導（其中大多數也可以用於其它的DBMS）。在這裡，我不打算介紹使用SQL Server的竅門，也不能提供一個包治百病的方案，我所做的是總結一些經驗----關於如何形成一個好的設計。

　　一、瞭解你用的工具

　　不要輕視這一點，這是我在這篇文章中講述的最關鍵的一條。也許你也看到有很多的SQL Server程式設計師沒有掌握全部的T-SQL命令和SQL Server提供的那些有用的工具。

　　“什麼？我要浪費一個月的時間來學習那些我永遠也不會用到的SQL命令？？？”，你也許會這樣說。對的，你不需要這樣做。但是你應該用一個週末瀏覽所有的 T-SQL命令。在這裡，你的任務是瞭解，將來，當你設計一個查詢時，你會記起來：“對了，這裡有一個命令可以完全實現我需要的功能”，於是，到MSDN 檢視這個命令的確切語法。

　　二、不要使用遊標

　　讓我再重複一遍：不要使用遊標。如果你想破壞整個系統的效能的話，它們倒是你最有效的首選辦法。大多數的初學者都使用遊標，而沒有意識到它們對效能造成的影響。它們佔用記憶體，還用它們那些不可思議的方式鎖定表，另外，它們簡直就像蝸牛。而最糟糕的是，它們可以使你的DBA所能做的一切效能優化等於沒做。不知你是否知道每執行一次FETCH就等於執行一次SELECT命令？這意味著如果你的遊標有10000條記錄，它將執行10000次SELECT！如果你使用一組SELECT、UPDATE或者DELETE來完成相應的工作，那將有效率的多。

　　初學者一般認為使用遊標是一種比較熟悉和舒適的程式設計方式，可很不幸，這會導致糟糕的效能。顯然，SQL的總體目的是你要實現什麼，而不是怎樣實現。

　　我曾經用T-SQL重寫了一個基於遊標的儲存過程，那個表只有100,000條記錄，原來的儲存過程用了40分鐘才執行完畢，而新的儲存過程只用了10秒鐘。在這裡，我想你應該可以看到一個不稱職的程式設計師究竟在幹了什麼！！！

　　我們可以寫一個小程式來取得和處理資料並且更新資料庫，這樣做有時會更有效。記住：對於迴圈，T-SQL無能為力。

　　我再重新提醒一下：使用遊標沒有好處。除了DBA的工作外，我從來沒有看到過使用遊標可以有效的完成任何工作。

　　三、規範化你的資料表

　　為什麼不規範化資料庫？大概有兩個藉口：出於效能的考慮和純粹因為懶惰。至於第二點，你遲早得為此付出代價。而關於效能的問題，你不需要優化根本就不慢的東西。我經常看到一些程式設計師“反規範化”資料庫，他們的理由是“原來的設計太慢了”，可結果卻常常是他們讓系統更慢了。DBMS被設計用來處理規範資料庫的，因此，記住：按照規範化的要求設計資料庫。

　　四、不要使用SELECT *

　　這點不太容易做到，我太瞭解了，因為我自己就經常這樣幹。可是，如果在SELECT中指定你所需要的列，那將會帶來以下的好處：

　　1 減少記憶體耗費和網路的頻寬

　　2 你可以得到更安全的設計

　　3 給查詢優化器機會從索引讀取所有需要的列

　　五、瞭解你將要對資料進行的操作

　　為你的資料庫建立一個健壯的索引，那可是功德一件。可要做到這一點簡直就是一門藝術。每當你為一個表新增一個索引，SELECT會更快了，可INSERT 和DELETE卻大大的變慢了，因為建立了維護索引需要許多額外的工作。顯然，這裡問題的關鍵是：你要對這張表進行什麼樣的操作。這個問題不太好把握，特別是涉及DELETE和UPDATE時，因為這些語句經常在WHERE部分包含SELECT命令。

　　六、不要給“性別”列建立索引

　　首先，我們必須瞭解索引是如何加速對錶的訪問的。你可以將索引理解為基於一定的標準上對錶進行劃分的一種方式。如果你給類似於“性別”這樣的列建立了一個索引，你僅僅是將表劃分為兩部分：男和女。你在處理一個有1,000,000條記錄的表，這樣的劃分有什麼意義？記住：維護索引是比較費時的。當你設計索引時，請遵循這樣的規則：根據列可能包含不同內容的數目從多到少排列，比如：姓名+省份+性別。

　　七、使用事務

　　請使用事務，特別是當查詢比較耗時。如果系統出現問題，這樣做會救你一命的。一般有些經驗的程式設計師都有體會-----你經常會碰到一些不可預料的情況會導致儲存過程崩潰。

　　八、小心死鎖

　　按照一定的次序來訪問你的表。如果你先鎖住表A，再鎖住表B，那麼在所有的儲存過程中都要按照這個順序來鎖定它們。如果你（不經意的）某個儲存過程中先鎖定表B，再鎖定表A，這可能就會導致一個死鎖。如果鎖定順序沒有被預先詳細的設計好，死鎖是不太容易被發現的。

　　九、不要開啟大的資料集

　　一個經常被提出的問題是：我怎樣才能迅速的將100000條記錄新增到ComboBox中？這是不對的，你不能也不需要這樣做。很簡單，你的使用者要瀏覽 100000條記錄才能找到需要的記錄，他一定會詛咒你的。在這裡，你需要的是一個更好的UI，你需要為你的使用者顯示不超過100或200條記錄。

　　十、不要使用伺服器端遊標

　　與伺服器端遊標比起來，客戶端遊標可以減少伺服器和網路的系統開銷，並且還減少鎖定時間。

　　十一、使用引數查詢

　　有時，我在CSDN技術論壇看到類似這樣的問題：“SELECT * FROM a WHERE a.id='A'B，因為單引號查詢發生異常，我該怎麼辦？”，而普遍的回答是：用兩個單引號代替單引號。這是錯誤的。這樣治標不治本，因為你還會在其他一些字元上遇到這樣的問題，更何況這樣會導致嚴重的bug，除此以外，這樣做還會使SQL Server的緩衝系統無法發揮應有的作用。使用引數查詢，釜底抽薪，這些問題統統不存在了。

　　十二、在程式編碼時使用大資料量的資料庫

　　程式設計師在開發中使用的測試資料庫一般資料量都不大，可經常的是終端使用者的資料量都很大。我們通常的做法是不對的，原因很簡單：現在硬碟不是很貴，可為什麼效能問題卻要等到已經無可挽回的時候才被注意呢？

　　十三、不要使用INSERT匯入大批的資料

　　請不要這樣做，除非那是必須的。使用UTS或者BCP，這樣你可以一舉而兼得靈活性和速度。

　　十四、注意超時問題

　　查詢資料庫時，一般資料庫的預設都比較小，比如15秒或者30秒。而有些查詢執行時間要比這長，特別是當資料庫的資料量不斷變大時。

　　十五、不要忽略同時修改同一記錄的問題

　　有時候，兩個使用者會同時修改同一記錄，這樣，後一個修改者修改了前一個修改者的操作，某些更新就會丟失。處理這種情況不是很難：建立一個timestamp欄位，在寫入前檢查它，如果允許，就合併修改，如果存在衝突，提示使用者。

　　十六、在細節表中插入紀錄時，不要在主表執行SELECT MAX(ID)

　　這是一個普遍的錯誤，當兩個使用者在同一時間插入資料時，這會導致錯誤。你可以使用SCOPE_IDENTITY，IDENT_CURRENT和IDENTITY。如果可能，不要使用IDENTITY，因為在有觸發器的情況下，它會引起一些問題（詳見這裡的討論）。

　　十七、避免將列設為NULLable

　　如果可能的話，你應該避免將列設為NULLable。系統會為NULLable列的每一行分配一個額外的位元組，查詢時會帶來更多的系統開銷。另外，將列設為NULLable使編碼變得複雜，因為每一次訪問這些列時都必須先進行檢查。

　　我並不是說NULLS是麻煩的根源，儘管有些人這樣認為。我認為如果你的業務規則中允許“空資料”，那麼，將列設為NULLable有時會發揮很好的作用，但是，如果在類似下面的情況中使用NULLable，那簡直就是自討苦吃。

　　CustomerName1
　　CustomerAddress1
　　CustomerEmail1
　　CustomerName2
　　CustomerAddress2
　　CustomerEmail3
　　CustomerName1
　　CustomerAddress2
　　CustomerEmail3

　　如果出現這種情況，你需要規範化你的表了。

　　十八、儘量不要使用TEXT資料型別

　　除非你使用TEXT處理一個很大的資料，否則不要使用它。因為它不易於查詢，速度慢，用的不好還會浪費大量的空間。一般的，VARCHAR可以更好的處理你的資料。

　　十九、儘量不要使用臨時表

　　儘量不要使用臨時表，除非你必須這樣做。一般使用子查詢可以代替臨時表。使用臨時表會帶來系統開銷，如果你是用COM+進行程式設計，它還會給你帶來很大的麻煩，因為COM+使用資料庫連線池而臨時表卻自始至終都存在。SQL Server提供了一些替代方案，比如Table資料型別。

　　二十、學會分析查詢

　　SQL Server查詢分析器是你的好夥伴，通過它你可以瞭解查詢和索引是如何影響效能的。

　　二十一、使用參照完整性

　　定義主健、唯一性約束和外來鍵，這樣做可以節約大量的時間。

關於一個資料庫列設計的問題
2007-04-09
資料庫
怎樣設計一個好的資料庫
2018-12-10
資料庫
如何設計一個資料庫中介軟體
2017-04-04
資料庫
關於資料庫表的設計步驟
2010-04-27
資料庫
請教：關於jive的資料庫設計
2003-03-14
資料庫
關於資料庫批次查詢的一個想法
2003-09-08
資料庫
關於資料庫設計的第一、二、三正規化
2016-12-27
資料庫
如何做出一個好的設計方案
2024-10-13
LSM設計一個資料庫引擎
2020-05-22
資料庫
關於Oracle中重啟資料庫的一個bug
2015-05-28
Oracle資料庫
好程式設計師大資料培訓分享關於kafka的幾個重要問題
2019-08-20
程式設計師大資料Kafka
關於資料驅動設計的6個誤區
2016-04-15
好程式設計師大資料點睛：關於HDFS的二三事
2019-05-15
程式設計師大資料
如何設計出一個好Logo
2013-09-10
Go
關於如何設計一個基於事件驅動架構的思考
2013-03-29
事件架構
一個關於資料庫關閉很有意思的現象
2012-04-05
資料庫
關於資料過濾的設計
2010-05-31
關於資料倉儲的設計！
2008-02-13
【資料庫設計】資料庫的設計
2018-06-21
資料庫
這個資料庫表如何設計的更優雅？
2020-08-12
資料庫
如何實現一個資料庫的 UDF？圖資料庫 NebulaGraph UDF 功能背後的設計與思考
2023-09-20
資料庫
資料庫設計---即資料庫架構設計的幾個步驟
2010-07-12
資料庫架構
一個關於資料庫閃回區問題的處理
2008-04-21
資料庫
關於資料日誌的設計方案
2006-01-18
設計資料庫關係模型
2018-04-01
資料庫模型
關聯式資料庫設計
2008-03-24
資料庫
關於資料許可權設計的一些想法
2016-06-08
關於資料儲存的一個故事
2012-12-06
關係型資料庫表結構的兩個設計技巧
2016-07-25
資料庫
關於後臺資料庫設計的考慮(手機平臺)
2020-04-06
資料庫
MySQL - [19] 關於個人負債為主題的資料庫設計
2024-08-29
MySql資料庫
關於資料庫中的一些name
2014-11-26
資料庫
程式設計師如何提一個好問題
2017-01-30
程式設計師
如何設計一個好的通訊網路協議
2020-04-01
協議
如何在程式設計生涯中有一個好的開端
2014-09-20
程式設計
關於Oracle 資料庫備份的幾個概念
2008-03-29
Oracle資料庫
網站建設-如何才能設計好一個網站
2011-09-03
網站
設計HBase資料庫資料表有關的建議
2016-05-17
資料庫

關於如何形成一個好的資料庫設計

相關文章