資料庫原理

Java3y發表於2018-03-04

什麼是資料庫?

資料庫是一個以某種有組織的方式儲存的資料集合。也就是:儲存有組織資料的容器(一個檔案或一組檔案)

為什麼我們需要資料庫?

毫無疑問,資料庫是用來儲存資料的。我們對excel肯定不會陌生,excel也是用來儲存資料。那既然有excel這樣非常好用的軟體了,為什麼需要資料庫呢??

  • excel儲存的資料量太少了。由於我們網路發展,excel的儲存量遠遠不能支撐我們的需求。
  • excel資料無法多人共享。excel只是一個單一的檔案,只能是當前的使用者使用並修改。
  • 資料安全性。對excle資料的修改是很隨意的。

資料庫就解決了上面的問題,並且資料庫以特殊的機制管理資料檔案,對資料有極高的讀寫速度,大大超過了作業系統對常規檔案的讀寫速度。

資料庫系統的組成

資料庫系統由三個層次組成:

  • 資料庫(dataBase)
    • 存放資料的倉庫,按照一定的格式(有組織的方式)進行儲存
  • 資料庫管理系統(dataBase Manager System)
    • 建立、管理、維護資料庫的系統軟體
  • 資料庫應用系統(dataBase Application System)
    • 使用到資料庫技術的應用軟體

這裡寫圖片描述


資料描述與資料模型

理解資料描述

我們在現實生活中描述一個事物是非常簡單的,看到“一棵樹”,就說是“一棵樹”

但怎麼把“一棵樹“在計算機描述起來呢??計算機只識別0和1”一棵樹“是不能直接儲存到計算機上的

於是乎,我們就把”一棵樹“抽象出來,形成資訊世界的概念模型。然後將概念模型的形式化成是DBMS支援的資料模型,儲存在計算機中

簡單來說:資料描述就是將現實世界中的實物抽象出來,形成概念模型。把概念模型的形式轉換成是DBMS支援的型別,然後儲存到計算機中!


理解資料模型

**資料模型主要用來描述資料!**上邊已經說了,當我們想在計算機上儲存現實事物的資料時,需要先抽象成概念模型。將概念模型轉換成DBMS支援的資料模型,就可以把事物儲存到計算機中!

資料模型一般由三個部分組成:

  • 資料結構(物件與物件之間的關係)
  • 資料操作(增刪改查)
  • 完整性約束(限定資料是有一定規則的,比如:年齡不能為負數)

資料模型也經歷了一個發展階段:

①:層次模型,是一種樹型(層次)結構來組織資料的資料模型。

這裡寫圖片描述

優點:

  • 結構清晰,容易理解
  • 節點之間聯絡可以通過指標來實現,查詢效率高

缺點:

  • 對於非層次結構的資料,表示起來非常麻煩,不直觀!

②:網狀模型, 是用有向圖結構來組織資料的資料模型

這裡寫圖片描述

優點:

  • 非常靈活,更能直接地描述現實世界的事物

缺點:

  • 結構複雜,非常難維護

③:關係模型,是一種用二維表格結構表示資料及資料之間聯絡的資料模型。

資料庫原理

關係模型是我們現在用得最多的資料模型。

優點:

  • 資料結構簡單、清晰。無論實體還是實體集,都用相對應的二維表來表示!
  • 有嚴格的數學理論根據 。各種關係運算(後面會講到)

缺點:

  • 查詢效率比非關係模型查,尤其是多表查詢的時候!

術語(基本概念)

我們對照著課程關係表來講解吧:

資料庫原理

實體(Entity)

客觀存在並可相互區別的事物稱之為實體。可以看成是Java類

例子:(課程關係表)就是一個實體。


屬性(Attribute)

實體所具有的某一特性稱之為屬性。可以看成是Java類的成員變數。屬性在資料庫中又稱為欄位(或者是列)

例子:(課程名),(課程號)、(學時)就是屬性名。


元組

除含有屬性名所在的行之外的其他行稱之為元組。

下面的每一行資料都稱之為元組 (C401001 資料結構 70) (C401002 作業系統 80) (C402001 計算機原理 60)


碼(Key)

碼也被稱作是關鍵字。它可以唯一標識一個實體

候選碼和主碼:

  • 候選碼:如果一組屬性集能唯一地標識一個關係中的元組而又不含有多餘的屬性,則稱該屬性集為該關係的候選碼 。(候選碼可能不止有一個
  • 主碼:使用者選定的那個候選鍵稱為主鍵

例子:郵寄地址(城市名,街道名,郵政編碼,單位名,收件人)

它有兩個候選鍵:{城市名,街道名} 和 {街道名,郵政編碼}

如果我選取{城市名,街道名}作為唯一標識實體的屬性,那麼{城市名,街道名} 就是主碼


關係模式

關係名和其屬性集合的組合稱之為關係模式

關係模式例子:課程關係表(課程號,課程名,學時)

提示:關係模型就是關係模式組成的集合


關係模型要求元組的每一個分量都是原子性的,也就是說,它必須屬於某種元素型別,如Integer、String等等,不能是列,集合,記錄,陣列!

域就代表著該元組中每個分量的型別,從上面的圖我們可以看出,它的域是這樣的:課程號:string,課程名:string,學時:int


資料庫體系內部結構

資料庫的體系內部結構我們可以分為三層:

  • 外模式
  • 邏輯模式
  • 內模式

三級模式的位置:

這裡寫圖片描述

三級模式的作用:

這裡寫圖片描述

邏輯模式

邏輯模式是對資料庫全部資料的整體邏輯結構的描述

例子:現在我有一個資料庫,操作許可權、角色、使用者之間的關係

於是有了以下的關係模式

  • 許可權關係(許可權編號,許可權名稱,許可權描述)
  • 角色關係(角色編號,角色名稱,角色描述)
  • 使用者關係(使用者編號,使用者名稱稱,使用者密碼)

在資料庫中所有關係模式的集合就組成了邏輯模式!


外模式

外模式是對資料庫使用者能看見和使用的區域性資料邏輯結構的描述,是與某一應用有關的資料的邏輯表示

外模式是可以有多個的,外模式是使用者和DBAS的介面,是對區域性邏輯結構的描述!

當使用者應用程式只需要顯示使用者名稱稱和密碼時:

  • 使用者關係(使用者名稱稱,使用者密碼)

在資料庫中操作區域性邏輯結構就稱作為外模式


內模式

內模式是對資料庫表物理儲存結構的描述。它定義了資料的內部記錄型別、記錄定址技術、索引和檔案的組織方式及資料控制方面的內容

這裡寫圖片描述


DB內部體系結構的兩級映像

兩級映像分別是:

  • 外模式和邏輯模式的映像
  • 邏輯模式和內模式的映像

這裡寫圖片描述

提出兩級對映的概念有什麼用呢?為什麼需要有這兩級映像呢??

  • 當資料庫的邏輯模式結構因某種原因修改時,只要沒有改變邏輯模式中與外模式定義有關的屬性及與其關係模式名的隸屬關係,就可使外模式保持不變,從而不需修改應用程式
  • 當資料庫的內模式由於某種原因要修改時,可通過對邏輯模式與內模式之間的映象的修改,使邏輯模式儘可能地保持不變,實現內模式的改變儘可能地不修改應用程式。

也就說:在改變內部結構的時候,只要不會觸及外部的資料時,外部的資料並不需要做改變。兩級映像概念的提出也就是程式中耦合的問題!


為什麼我們要學習資料庫關係運算?

學習和理解關係運算的機理,對於理解關聯式資料庫中的資料查詢機制有十分重要的意義。

我們可能知道多表查詢的時候要消除重複多餘的資料,那重複多餘的資料怎麼產生的呢??WHERE字句又是怎麼篩選資料的呢??這些問題我們在關係運算中可以找到答案的。

學習資料庫的關係運算,會讓我們明白SQL語句是怎麼執行的,是通過什麼手段讓我們得到想要的結果。


學習大綱

這裡寫圖片描述

笛卡爾積

什麼是笛卡爾積?

笛卡爾積簡單來說就是兩個集合相乘的結果

為什麼查詢資料庫會出現笛卡爾積

前面的博文已經說了,關係模型是關係模式的集合

資料庫中的兩張表就相當於兩個集合,當我們使用SELECT語句查詢資料的時候,DBMS內部就是以集合相乘的運算得出結果

笛卡爾積的產生過程

我們發現:笛卡爾積的基數是每個集合的元組相乘

這裡寫圖片描述

得出來的資料內容是難以符合現實中的實際情況的

這裡寫圖片描述

為了更好地看見效果,我都會以實際的SQL語句來看效果,然後說明問題的。

emp表的記錄有14條:

這裡寫圖片描述

dept表有4條記錄:

這裡寫圖片描述

我們來看看SMITH,在emp表中,他只在20部門。

這裡寫圖片描述

但在兩張表查詢後,10、20、30、40部門他都在了!!我們再觀察56條資料,發現每個人都有4個部門,這樣的資料是不合理的!!

這裡寫圖片描述

再回到初衷,我們查詢兩張表的目的是什麼??**在查詢員工資訊的同時,也能知道員工的部門名稱是什麼!!!**所以,我們查詢的記錄數是不應該有56條這麼多的。。我們查詢的記錄數應該是員工表的記錄數,也就是14條而已!

我們再來分析:emp表中有deptno欄位,dept表中也有deptno欄位!而且發現,emp表中的deptno欄位的取值範圍是由dept表中deptno欄位來決定的!!!

所以,我們可以使用等值連線(emp.deptno=dept.deptno)來消除笛卡爾積,這樣就達到我們的目的了!

這裡寫圖片描述


基於傳統集合理論的關係運算

在Oracle上,操作集合的語法提供了4個關鍵字:

  • UNION(並集,重複的元組不顯示)
  • UNION ALL(並集,重複的元組也會顯示)
  • MINUS(差集)
  • INTERSECT(交集)

顯示查詢結果的全部資訊,消除重複的元組

這裡寫圖片描述

查詢所有辦事員和經理的資訊


	SELECT *
	FROM emp
	WHERE job = 'MANAGER'
	
	UNION

	SELECT *
	FROM emp
	WHERE job = 'CLERK';

複製程式碼

這裡寫圖片描述

注意:使用UNION並操作,比使用關鍵字OR的效能要好!


返回查詢結果相同的部分

這裡寫圖片描述

查詢10部門的資訊


SELECT *
FROM dept

INTERSECT 
SELECT *
FROM dept
WHERE deptno = 10;


複製程式碼

(全部部門和部門10只有部門10是相同的,所以最後返回的是部門10的結果)

這裡寫圖片描述


返回的查詢結果是

這裡寫圖片描述

這裡寫圖片描述


SELECT *
FROM dept

MINUS
SELECT *
FROM dept
WHERE deptno = 10;


複製程式碼

這裡寫圖片描述


關係代數特有的關係運算

投影

投影的運算過程:

首先按照j1,j2,…,jk的順序,從關係R 中取出列序號為j1,j2,…,jk(或屬性名序列為Aj1,Aj2,…,Ajk )的k 列,然後除去結果中的重複元組,構成一個以Aj1,Aj2,…,Ajk為屬性順序的k 目關係。

簡單來說:取出一個查詢結果中某某列,並消除重複的資料,這就是投影!

  • 投影是從列的角度進行的運算
  • 投影的下標可是列序號,也可是列屬性名

查詢出所有部門的編號




SELECT deptno
FROM dept;

複製程式碼

查詢時的過程:先查詢得出dept表的所有結果,再通過投影運算只提取"deptno"的列資料,如果 SELECT 後邊跟的是"*",那麼就是投影全部資料!

這裡寫圖片描述


選擇

使用比較運算子、邏輯運算子,挑出滿足條件的元組,運算出結果!

查詢出工資大於2000的員工的姓名



SELECT ename
FROM emp
WHERE sal > 2000;

複製程式碼

過程:首先查詢出emp表的所有結果,使用選擇運算篩選得出工資大於2000的結果,最後使用投影運算得出工資大於2000員工的名字!

這裡寫圖片描述


除運算

除運算的實際應用我還沒想明白~~~如果有朋友知道除運算能夠用在資料庫的哪處,請告訴我一聲哈。。

我們也瞭解一下除運算的過程吧:關係R有ABCD,關係S有CD,首先投影出AB(因為S有CD),再用投影出來AB的結果和關係S做笛卡爾積運算。如果做的笛卡爾積運算記錄在R關係中找到相對應的記錄,那麼投影的AB就是結果了!

這裡寫圖片描述


連線運算

連線運算其實就在笛卡爾積運算的基礎上限定了條件(某列大於、小於、等於某列),只匹配和條件相符合的,從而得出結果!

自然連線

自然連線就是一種特殊的連線運算,它限定的條件是【某列等於某列】。自然連線我們經常使用到。消除笛卡爾積其實就是自然連線了!


SELECT *
FROM emp, dept
WHERE dept.deptno = emp.deptno;

複製程式碼

設定將dept表的deptno列和emp的deptno列為相同【這就是自然連線】


如果文章有錯的地方歡迎指正,大家互相交流。習慣在微信看技術文章,想要獲取更多的Java資源的同學,可以關注微信公眾號:Java3y

相關文章