資料庫設計規範化的 5 個要求

hawkks發表於2016-03-09

通常情況下,可以從兩個方面來判斷資料庫是否設計的比較規範。一是看看是否擁有大量的窄表,二是寬表的數量是否足夠的少。若符合這兩個條件,則可以說明這個資料庫的規範化水平還是比較高的。

當然這是兩個泛泛而談的指標。為了達到資料庫設計規範化的要求,一般來說,需要符合以下五個要求。

要求一:表中應該避免可為空的列。

雖然表中允許空列,但是,空欄位是一種比較特殊的資料型別。資料庫在處理的時候,需要進行特殊的處理。如此的話,就會增加資料庫處理記錄的複雜性。當表中有比較多的空欄位時,在同等條件下,資料庫處理的效能會降低許多。

所以,雖然在資料庫表設計的時候,允許表中具有空欄位,但是,我們應該儘量避免。若確實需要的話,我們可以通過一些折中的方式,來處理這些空欄位,讓其對資料庫效能的影響降低到最少。

一是通過設定預設值的形式,來避免空欄位的產生。如在一個人事管理系統中,有時候身份證號碼欄位可能允許為空。因為不是每個人都可以記住自己的身份證號碼。而在員工報到的時候,可能身份證沒有帶在身邊。所以,身份證號碼欄位往往不能及時提供。為此,身份證號碼欄位可以允許為空,以滿足這些特殊情況的需要。但是,在資料庫設計的時候,則可以做一些處理。如當使用者沒有輸入內容的時候,則把這個欄位的預設值設定為0或者為N/A。以避免空欄位的產生。

二是若一張表中,允許為空的列比較多,接近表全部列數的三分之一。而且,這些列在大部分情況下,都是可有可無的。若資料庫管理員遇到這種情況,筆者建議另外建立一張副表,以儲存這些列。然後通過關鍵字把主表跟這張副表關聯起來。將資料儲存在兩個獨立的表中使得主表的設計更為簡單,同時也能夠滿足儲存空值資訊的需要。

要求二:表不應該有重複的值或者列。

如現在有一個進銷存管理系統,這個系統中有一張產品基本資訊表中。這個產品開發有時候可以是一個人完成,而有時候又需要多個人合作才能夠完成。所以,在產品基本資訊表產品開發者這個欄位中,有時候可能需要填入多個開發者的名字。

如進銷存管理中,還需要對客戶的聯絡人進行管理。有時候,企業可能只知道客戶一個採購員的姓名。但是在必要的情況下,企業需要對客戶的採購代表、倉庫人員、財務人員共同進行管理。因為在訂單上,可能需要填入採購代表的名字;可是在出貨單上,則需要填入倉庫管理人員的名字等等。

為了解決這個問題,有多種實現方式。但是,若設計不合理的話在,則會導致重複的值或者列。如我們也可以這麼設計,把客戶資訊、聯絡人都放入同一張表中。為了解決多個聯絡人的問題,可以設定第一聯絡人、第一聯絡人電話、第二聯絡人、第二聯絡人電話等等。若還有第三聯絡人、第四聯絡人等等,則往往還需要加入更多的欄位。

可是這麼設計的話,會產生一系列的問題。如客戶的採購員流動性比較大,在一年內換了六個採購員。此時,在系統中該如何管理呢?難道就建立六個聯絡人欄位?這不但會導致空欄位的增加,還需要頻繁的更改資料庫表結構。明顯,這麼做是不合理的。也有人說,可以直接修改採購員的名字呀。可是這麼處理的話,會把原先採購訂單上採購員的名字也改變了。因為採購單上客戶採購員資訊在資料庫中儲存的不是採購員的名字,而只是採購員對應的一個編號。在編號不改而名字改變了的情況下,採購訂單上顯示的就是更改後的名字。這不利於時候的追蹤。

所以,在資料庫設計的時候要儘量避免這種重複的值或者列的產生。筆者建議,若資料庫管理員遇到這種情況,可以改變一下策略。如把客戶聯絡人另外設定一張表。然後通過客戶ID把供應商資訊表跟客戶聯絡人資訊表連線起來。也就是說,儘量將重複的值放置到一張獨立的表中進行管理。然後通過檢視或者其他手段把這些獨立的表聯絡起來。

要求三:表中記錄應該有一個唯一的識別符號。

在資料庫表設計的時候,資料庫管理員應該養成一個好習慣,用一個ID號來唯一的標識行記錄,而不要通過名字、編號等欄位來對紀錄進行區分。每個表都應該有一個ID列,任何兩個記錄都不可以共享同一個ID值。另外,這個ID值最好有資料庫來進行自動管理,而不要把這個任務給前臺應用程式。否則的話,很容易產生ID值不統一的情況。

另外,在資料庫設計的時候,最好還能夠加入行號。如在銷售訂單管理中,ID號是使用者不能夠維護的。但是,行號使用者就可以維護。如在銷售訂單的行中,使用者可以通過調整行號的大小來對訂單行進行排序。通常情況下,ID列是以1為單位遞進的。但是,行號就要以10為單位累進。如此,正常情況下,行號就以10、20、30依次擴充套件下去。若此時使用者需要把行號為30的紀錄調到第一行顯示。此時,使用者在不能夠更改ID列的情況下,可以更改行號來實現。如可以把行號改為1,在排序時就可以按行號來進行排序。如此的話,原來行號為30的紀錄現在行號變為了1,就可以在第一行中顯示。這是在實際應用程式設計中對ID列的一個有效補充。這個內容在教科書上是沒有的。需要在實際應用程式設計中,才會掌握到這個技巧。

要求四:資料庫物件要有統一的字首名。

一個比較複雜的應用系統,其對應的資料庫表往往以千計。若讓資料庫管理員看到物件名就瞭解這個資料庫物件所起的作用,恐怕會比較困難。而且在資料庫物件引用的時候,資料庫管理員也會為不能迅速找到所需要的資料庫物件而頭疼。

為此,筆者建立,在開發資料庫之前,最好能夠花一定的時間,去制定一個資料庫物件的字首命名規範。如筆者在資料庫設計時,喜歡跟前臺應用程式協商,確定合理的命名規範。筆者最常用的是根據前臺應用程式的模組來定義後臺資料庫物件字首名。如跟物料管理模組相關的表可以用M為字首;而以訂單管理相關的,則可以利用C作為字首。具體採用什麼字首可以以使用者的愛好而定義。但是,需要注意的是,這個命名規範應該在資料庫管理員與前臺應用程式開發者之間達成共識,並且嚴格按照這個命名規範來定義物件名。

其次,表、檢視、函式等最好也有統一的字首。如檢視可以用V為字首,而函式則可以利用F為字首。如此資料庫管理員無論是在日常管理還是物件引用的時候,都能夠在最短的時間內找到自己所需要的物件。

要求五:儘量只儲存單一實體型別的資料。

這裡將的實體型別跟資料型別不是一回事,要注意區分。這裡講的實體型別是指所需要描述物件的本身。筆者舉一個例子,估計大家就可以明白其中的內容了。如現在有一個圖書館裡系統,有圖書基本資訊、作者資訊兩個實體物件。若使用者要把這兩個實體物件資訊放在同一張表中也是可以的。如可以把表設計成圖書名字、圖書作者等等。可是如此設計的話,會給後續的維護帶來不少的麻煩。

如當後續有圖書出版時,則需要為每次出版的圖書增加作者資訊,這無疑會增加額外的儲存空間,也會增加記錄的長度。而且若作者的情況有所改變,如住址改變了以後,則還需要去更改每本書的記錄。同時,若這個作者的圖書從資料庫中全部刪除之後,這個作者的資訊也就蕩然無存了。很明顯,這不符合資料庫設計規範化的需求。

遇到這種情況時,筆者建議可以把上面這張表分解成三種獨立的表,分別為圖書基本資訊表、作者基本資訊表、圖書與作者對應表等等。如此設計以後,以上遇到的所有問題就都引刃而解了。

以上五條是在資料庫設計時達到規範化水平的基本要求。除了這些另外還有很多細節方面的要求,如資料型別、儲存過程等等。而且,資料庫規範往往沒有技術方面的嚴格限制,主要依靠資料庫管理員日常工作經驗的累積。

相關文章