分散式資料庫概述

發表於2016-03-06

一、前言

隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴充,資料庫應用已經普遍建立於計算機網路之上。這時集中式資料庫系統表現出它的不足:資料按實際需要已在網路上分佈儲存,再採用集中式處理,勢必造成通訊開銷大;應用程式集中在一臺計算機上執行,一旦該計算機發生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的“集中計算”概念向“分佈計算”概念發展。分佈計算主要體現在客戶機/伺服器模式和分散式資料庫體系結構兩個方面。

二、分散式資料庫系統概述

隨著傳統的資料庫技術日趨成熟、計算機網路技術的飛速發展和應用範圍的擴大,以分散式為主要特徵的資料庫系統的研究與開發受到人們的注意。分散式資料庫是資料庫技術與網路技術相結合的產物,在資料庫領域已形成一個分支。分散式資料庫的研究始於20世紀70年代中期。世界上第一個分散式資料庫系統SDD-1是由美國計算機公司(CCA)於1979年在DEC計算機上實現。20世紀90年代以來,分散式資料庫系統進入商品化應用階段,傳統的關聯式資料庫產品均發展成以計算機網路及多工作業系統為核心的分散式資料庫產品,同時分散式資料庫逐步向客戶機/伺服器模式發展。

三、DDBS(Distributed Database System)的分類

(1)同構同質型DDBS:各個場地都採用同一型別的資料模型(譬如都是關係型),並且是同一型號的DBMS。

(2)同構異質型DDBS:各個場地採用同一型別的資料模型,但是DBMS的型號不同,譬如DB2、ORACLE、SYBASE、SQL Server等。

(3)異構型DDBS:各個場地的資料模型的型號不同,甚至型別也不同。隨著計算機網路技術的發展,異種機聯網問題已經得到較好的解決,此時依靠異構型DDBS就能存取全網中各種異構區域性庫中的資料。

四、DDBS的特點和優缺點

DDBS的基本特點:

(1)物理分佈性:資料不是儲存在一個場地上,而是儲存在計算機網路的多個場地上。

(2)邏輯整體性:資料物理分佈在各個場地,但邏輯上是一個整體,它們被所有使用者(全域性使用者)共享,並由一個DDBMS統一管理。

(3)場地自治性:各場地上的資料由本地的DBMS管理,具有自治處理能力,完成本場地的應用(區域性應用)。

(4)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成一個整體。

DDBS的其他特點

(1)資料獨立性

(2)集中與自治相結合的控制機制

(3)適當增加資料冗餘度

(4)事務管理的分佈性

DDBS的優點

(1)具有靈活的體系結構

(2)適應分散式的管理和控制機構

(3)經濟效能優越

(4)系統的可靠性高、可用性好

(5)區域性應用的響應速度快

(5)可擴充套件性好,易於整合現有的系統

DDBS的缺點

(1)系統開銷較大,主要花在通訊部分 。

(2)複雜的存取結構(如輔助索引、檔案的連結技術),在集中式DBS中是有效存取資料的重要技術,但在分散式系統中不一定有效。

(3)資料的安全性和保密性較難處理。

五、資料分片

型別:

(1)水平分片:按一定的條件把全域性關係的所有元組劃分成若干不相交的子集,每個子集為關係的一個片段。

(2)垂直分片:把一個全域性關係的屬性集分成若干子集,並在這些子集上作投影運算,每個投影稱為垂直分片。

(3)匯出分片:又稱為匯出水平分片,即水平分片的條件不是本關係屬性的條件,而是其他關係屬性的條件。

(4)混合分片:以上三種方法的混合。可以先水平分片再垂直分片,或先垂直分片再水平分片,或其他形式,但他們的結果是不相同的。

條件:

(1)完備性條件:必須把全域性關係的所有資料對映到片段中,決不允許有屬於全域性關係的資料卻不屬於它的任何一個片段。

(2)可重構條件:必須保證能夠由同一個全域性關係的各個片段來重建該全域性關係。對於水平分片可用並操作重構全域性關係;對於垂直分片可用聯接操作重構全域性關係。

(3)不相交條件:要求一個全域性關係被分割後所得的各個資料片段互不重疊(對垂直分片的主鍵除外)。

六、資料分配方式

(1)集中式:所有資料片段都安排在同一個場地上。

(2)分割式:所有資料只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。

(4)全複製式:資料在每個場地重複儲存。也就是每個場地上都有一個完整的資料副本。

(5)混合式:這是一種介乎於分割式和全複製式之間的分配方式。

七、體系結構

  • 資料分片和資料分配概念的分離,形成了“資料分佈獨立型”概念。
  • 資料冗餘的顯式控制。資料在各個場地的分配情況在分配模式中一目瞭然,便於系統管理。
  • 區域性DBMS的獨立性。這個特徵也稱為“區域性對映透明性”。此特徵允許我們在不考慮區域性DBMS專用資料模型的情況下,研究DDB管理的有關問題。

八、分散式資料庫管理系統

  • 接受使用者請求,並判定把它送到哪裡,或必須訪問哪些計算機才能滿足該要求。
  • 訪問網路資料字典,瞭解如何請求和使用其中的資訊。
  • 如果目標資料儲存於系統的多個計算機上,就必須進行分散式處理。
  • 通訊介面功能。在使用者、區域性DBMS和其他計算機的DBMS之間進行協調。
  • 在一個異構型分散式處理環境中,還需提供資料和程式移植的支援。這裡的異構型是指各個場地的硬體、軟體之間存在著差別。

九、小結

(1)“分佈計算”概念突破了集中式DBS的框架,資料分佈使系統走上分散式DB的道路,功能分佈使系統走上C/S道路。這是DBS的兩個發展。

(2)C/S系統包括一個計算機網路,通常用一個區域網連結。幾乎在所有情況下,客戶機都是微機;伺服器有時用小型機或大型機,但多數情況下也使用微機或高檔微機。應用程式在客戶機上處理,DBMS和OS的資料管理分放在伺服器上。

(3)C/S結構經歷了從兩層、三層到多層的演變過程。總的趨勢是使客戶機越來越“瘦”,變成瀏覽器;而伺服器的種類越來越多,容易實現系統的組裝。

(4)C/S系統使應用與使用者更加貼近,為使用者提供較好的效能和更復雜的介面。

(5)分散式系統是在集中式系統的基礎上發展而來的。DDB是資料庫技術與網路技術結合的產物。隨著計算機網路技術的飛速發展,DDBS日趨成為資料庫領域的主流方向。

(6)DDB具有資料分佈性和邏輯整體性的特點。DDBS能夠支援涉及多個場地的全域性應用。DDB的資料儲存有資料分片和資料分配兩種策略。

(7)DDB的模式結構為理解DDBS提供了一種通用的概念結構。分佈透明性是DDBS追求的目標。DDBMS是負責管理分佈環境下,邏輯整合資料的存取、一致性、有效性和完備性的軟體系統。

(8)DDBS中資料分佈在各個場地,系統中壓倒一切的效能目標是儘量減少網路中傳送資訊的次數和傳送的資料量。分散式查詢中基於半聯接的優化策略是常用的技術。

(9)對於併發控制和恢復,DDBMS環境中會出現大量在集中式DBMS環境中碰不到的問題。分散式的併發控制有主場地方法和主拷貝方法,再輔之於備份場地技術。

相關文章