資料描述的三個領域

Coding-lover發表於2015-09-24

1. 現實世界

現實世界是存在於人們頭腦之外的客觀世界,是客觀事物及其互相的聯絡。例如學校教學管理中涉及的學生管理、教師管理、課程管理。管理者要求:每個學期開學時製作學生選修課程情況表,內容包括學號、姓名、課程名、選修課類別(類別分為必修、選修);每個學期結束時製作學生選修課程成績表,內容包括學號、姓名、課程名、選修課的類別、總評成績;製作教師授課安排表,內容包括教師號、教師名,課程名,授課類別(授課類別分為主講、輔導、實驗)、學時數、班級數等。這就是現實世界,是資料庫設計者接觸到的最原始的資料,資料庫設計者對這些原始資料進行綜合、抽象成為資料庫技術所能處理的資料。對現實世界的資料描述,就成為資訊世界。

2. 資訊世界

資訊世界是現實世界的符號描述,即將客觀世界用資料來描述。例如,學生是客觀世界的個體,可以用一組資料(學號、姓名、性別、年齡、班級、成績)來描述,有這樣一組資料不見其人便可以瞭解該學生的基本情況。因此可以說資訊世界就是我們所說的資料世界。資訊世界中的術語包括:

(1) 實體。客觀世界存在的、可以區別的事物稱為實體。實體可以是具體的事物,例如學生李,教師張、數學課,也可以是抽象的事件,例如:本學期學生李選修了哪些課程,教師張教授了哪門課程,讀者的一次借閱活動等。

(2) 屬性。實體有很多特性,每個特性稱為實體的一個屬性,每個屬性有一個型別。例如學生實體的屬性有:學號、姓名、性別、年齡、班級、成績,其中學號、姓名、班級的型別為字元型,性別的型別為邏輯型,年齡的型別為整型。

(3) 實體集。性質相同的實體的集合。例如全體學生的集合,全體教師集合等。

(4) 實體識別符號。能夠唯一標識實體的屬性或屬性的集合。如學生實體的屬性:學號,能夠唯一確定一個學生,因此可以作為學生實體集的識別符號。

3. 機器世界

資訊世界中的資料在機器世界中的儲存,成為計算機的資料。機器世界中對資料的描述採用資料庫技術的專業術語,對應於資訊世界的術語有以下四個專業術語:

(1) 記錄。對應於資訊世界中的每一個實體的資料。例如學生這一實體的一組資料(20100301001,孤傲蒼狼,男,20,計算機0901,87)就是一條記錄

(2) 欄位,對應於資訊世界中的屬性,在資料庫技術中稱為欄位,學生實體中學號、姓名、性別、班級、成績都是欄位,每個欄位都有它的型別、取值範圍,欄位的取值範圍稱為欄位的域。

(3) 資料檔案。對應於資訊世界的實體集。由若干個相同型別記錄組成的資料集合,在資料庫系統中以檔案(二維表)的形式存放。

(4) 關鍵字。能夠唯一標識記錄的欄位或欄位表示式,與資訊世界中的實體識別符號相對應,例如學生實體中的學號可以作為學生的關鍵字。

從客觀世界到資訊世界不是簡單的資料描述,而是從客觀世界中抽象出適合資料庫技術研究的資料。同時要求這些資料能夠很好地反映客觀世界的事物;從資訊世界到機器世界也不再是簡單的資料對應儲存,而是要設計資料的邏輯結構和物理儲存結構。所謂資料的邏輯結構是指程式設計師或使用者用以操作的資料形式,資料的邏輯結構是資料本身所具有的特性,是現實世界的抽象;所謂資料的物理結構是實際儲存在儲存裝置上的資料。

在資料庫系統中,資料的邏輯結構於資料的物理結構之間可以差別很大,資料的邏輯結構面向程式設計師,資料的物理結構面向機器。資料庫管理軟體的功能之一,就是要能夠把資料的邏輯結構映像為資料的物理結構,把資料的物理結構映像為資料的邏輯結構。

轉載自:資料描述的三個領域

相關文章