設計關聯式資料庫時,遵從不同的規範要求,設計出合理的關係型資料庫,這些不同的規範要求被稱為不同的正規化,各種正規化呈遞次規範,越高的正規化資料庫冗餘越小。
目前關聯式資料庫有六種正規化:第一正規化(1NF)、第二正規化(2NF)、第三正規化(3NF)、巴斯-科德正規化(BCNF)、第四正規化(4NF)和第五正規化(5NF,還又稱完美正規化)。
在實際中,前面的三種,已能滿足一般的資料庫設計要求。
第一正規化(1NF)
所謂第一正規化(1NF)是指在關係模型中,對域新增的一個規範要求,所有的域都應該是原子性的,即資料庫表的每一列都是不可分割的原子資料項,而不能是集合,陣列,記錄等非原子資料項。即實體中的某個屬性有多個值時,必須拆分為不同的屬性。在符合第一正規化(1NF)表中的每個域值只能是實體的一個屬性或一個屬性的一部分。簡而言之,第一正規化就是無重複的域。
簡記:1NF 欄位不可分。
不符合1NF的例子:
學號 |
姓名 |
年齡 |
出生年月 |
父母親 |
課程 |
學分 |
成績 |
等級 |
001 |
張三 |
20 |
1996-02 |
父:張無忌, 母:韓梅梅 |
數學 |
5 |
80 |
良 |
觀察上表會很容易發現欄位父母親身可分為父親和母親的,設計如下:
學號 |
姓名 |
年齡 |
出生年月 |
父親 |
母親 |
課程 |
學分 |
成績 |
等級 |
001 |
張三 |
20 |
1996-02 |
張無忌 |
韓梅梅 |
數學 |
5 |
80 |
良 |
第二正規化(2NF)
第二正規化(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關係。為實現區分通常需要為表加上一個列,以儲存各個例項的唯一標識。簡而言之,第二正規化就是在第一正規化的基礎上屬性完全依賴於主鍵。
簡記:2NF有主鍵,非主鍵欄位依賴主鍵。
不符合2NF的例子:
學號 |
姓名 |
年齡 |
出生年月 |
父親 |
母親 |
課程 |
學分 |
成績 |
等級 |
001 |
張三 |
20 |
1996-02 |
張無忌 |
韓梅梅 |
數學 |
5 |
80 |
良 |
001 |
張三 |
20 |
1996-02 |
張無忌 |
韓梅梅 |
語文 |
5 |
90 |
優 |
符合2NF的例子:
學號 |
姓名 |
年齡 |
出生年月 |
父親 |
母親 |
001 |
張三 |
20 |
1996-02 |
張無忌 |
韓梅梅 |
編號 |
課程 |
學分 |
2001 |
數學 |
5 |
2002 |
語文 |
5 |
編號 |
學號 |
課程 |
成績 |
等級 |
1001 |
001 |
2001 |
80 |
良 |
1002 |
001 |
2002 |
90 |
優 |
第三正規化(3NF)
在1NF基礎上,任何非主屬性不依賴於其它非主屬性[在2NF基礎上消除傳遞依賴]。第三正規化(3NF)是第二正規化(2NF)的一個子集,即滿足第三正規化(3NF)必須滿足第二正規化(2NF)。它要求一個關係中不包含已在其它關係包含的非主關鍵字資訊。
簡記:3NF非主鍵欄位不能相互依賴。
不符合3NF的例子:
學號 |
姓名 |
年齡 |
出生年月 |
父親 |
母親 |
001 |
張三 |
20 |
1996-02 |
張無忌 |
韓梅梅 |
編號 |
學號 |
課程 |
成績 |
等級 |
1001 |
001 |
2001 |
80 |
良 |
1002 |
001 |
2002 |
90 |
優 |
符合3NF的例子:
學號 |
姓名 |
出生年月 |
父親 |
母親 |
001 |
張三 |
1996-02 |
張無忌 |
韓梅梅 |
編號 |
學號 |
課程 |
成績 |
1001 |
001 |
2001 |
80 |
1002 |
001 |
2002 |
90 |
編號 |
級別 |
分數線 |
3001 |
優 |
90 |
3002 |
良 |
80 |