分散式資料庫的定義和特點

老魚筆記發表於2023-10-26

分散式資料庫的定義

分散式資料庫是一種將資料儲存在多個物理或邏輯位置的資料庫,它允許在不同的節點上進行資料處理和儲存,透過網路連線這些節點,形成一個整體。

根據國際權威諮詢機構Gartner在Hype Cycle中的描述,以及Forrester在全球分散式資料平臺趨勢報告(Now Tech_ Globally Distributed Data Platforms, Q4 2021)中的定義,分散式資料庫是一種能夠提供跨地域資料訪問能力的資料庫。分散式資料庫需要保證區域間資料一致性,在部分節點故障或者網路故障時仍舊能持續保持資料庫的可用性,同時在叢集內提供資料儲存區域的管控,滿足合規要求。

更簡單的說,分散式資料庫是在多臺計算機上執行和儲存資料的資料庫,而不是在一臺計算機上執行所有操作。通常,分散式資料庫在計算機網路上的兩個或多個互連的伺服器上執行。執行資料庫版本的每個位置通常稱為例項或節點。

例如,分散式資料庫可能具有在紐約、俄亥俄和加利福尼亞州執行的例項。或者,它可能在紐約的三臺獨立計算機上執行例項。相比之下,傳統的單例項資料庫僅在一臺計算機上的單個位置執行。

分散式資料庫的特點

1、跨區域提供一致且可信的資料

分散式資料庫可以儲存來自多種來源和格式的統一資料,以跨區域提供一致和可信的資料,從而支援現代業務應用程式和混合工作負載,有助於最大限度地減少應用層的資料整合,並確保資料的一致性和完整性。

2、高可用性

業務連續性已變得至關重要,特別是在支援區域和全球需求方面。分散式資料庫提供了內建的高可用性(HA)功能,可在各個地理分佈區域提供全天候資料可用性,並且零停機時間防止伺服器或資料中心故障。

3、高可擴充套件性

在業務不斷增長的環境中,資料庫的儲存和計算需求將隨著時間的推移而增加,並且並不總是以可預測的速度增加。試圖在單例項資料庫上跟上這一點是很困難的 - 您要麼必須支付超出您需要的費用,以便您的資料庫在儲存和計算能力方面具有“增長空間”,要麼您必須導航定期硬體升級和遷移以確保資料庫例項始終在能夠處理當前負載的機器上執行。相比之下,分散式資料庫通常可以透過簡單地新增額外的例項或節點來擴充套件。在某些情況下,此過程是手動的(儘管可以編寫指令碼),而在分散式無伺服器資料庫的情況下,它是完全自動化的。在幾乎所有情況下,擴充套件和縮減分散式資料庫的過程都比嘗試對單例項資料庫執行相同的操作要簡單得多。

4、改進的效能

根據其配置方式,分散式資料庫可能能夠比單例項資料庫更有效地執行,因為它可以在多個例項之間分配計算工作負載,而不是因為必須在同一臺計算機上執行所有讀取和寫入而受到瓶頸。

5、地理位置分佈資料庫可以減少延遲

儘管並非所有分散式資料庫都支援多區域部署,但支援多區域部署的分散式資料庫還可以透過減少延遲來提高使用者的應用程式效能。當資料可以位於地理位置靠近請求資料的使用者的資料庫例項上時,與應用程式需要從地球另一端(例如)的資料庫例項中提取資料的使用者相比,該使用者可能具有更低的延遲應用程式體驗。

分散式資料庫 VS 傳統集中式資料庫

分散式資料庫與傳統集中式資料庫的區別,通俗的來說,集中式資料庫就像汽車,單個汽車容量有限,要想拉更多貨,只能換更大的車。分散式資料庫更像是火車,要想拉更多貨,直接加車廂,每個車廂有動力,不怕火車拉不動。

與傳統的集中式資料庫相比,分散式資料庫可以更好地應對大規模資料儲存和處理的需求。最明顯的特點有2個,就是高可用和可擴充套件性。

由於資料儲存在多個節點上,分散式資料庫可以在單個節點故障的情況下仍然保持可用性,從而減少了資料儲存和處理中斷的可能性。

分散式資料庫可以透過增加節點的方式進行橫向擴充套件,從而提高資料儲存和處理的效能和吞吐量,可以更好地應對資料規模的增長。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/11310314/viewspace-2991365/,如需轉載,請註明出處,否則將追究法律責任。

相關文章