「分散式技術專題」資料分佈(資料複製、資料分片及優劣勢)

Hubble資料庫發表於2023-02-14

資料複製

對於那些需要在多個場地上對資料進行更新的應用來說,自動快照的功能就顯得很不夠了。這些應用要求同一個表的多份複製在多個場上進行維護。把資料複製到遠端節點,使資料更容易被系統中的較遠的使用者訪問,從而境加了系統的本地自治度。分散式資料庫必須解決一個重要問題是,保持所有複製的同步更新。

當同一表的多個複製存在時,訪問這些分佈資料的使用者應該不會察覺這些副本的位置。否則,使用者必須依靠系統當前的位置和當前維護的副本的編號進行修改。

複製、資料一致性和位位置透明性都是分散式資料庫複製資料時要完成的功能。這些功能在設計和實現上都有一定難度。有些難題只能透過限制對分散式資料的訪問來解決。

資料分片

資料複製是針對整個表的,資料分片處理物件是表的部分資料。可以說複製是分片的一種特殊情況。資料分片是和中複雜的資料分佈技術。基本地自治度不如資料複製高。但是,資料分片和資料複製都且有實現複雜的缺點。特別是考慮到應用對資料進行透明訪問時。這一缺點更為突出。

資料分佈分析

分散式資料的位置取決於邏輯資料和處理(讀或更新)模式,資訊量及其它特徵;資料分片是降低整個分散式系統開銷的有效方法。

優勢與劣勢

優勢

更適合分散式的管理與控制。分散式資料庫系統的結構更適合具有地理分佈的特性的組織或機構使用,允話分佈在不同區域、不同級別的各個部門對其自身的資料實行區域性控制。

具有靈活的體系結構。分散式 ovgt據庫系統的場地區域性的自治性,使得大部分的區域性事務管理和控制能就地解決,只有在涉及其他場地的資料時才需要透過網路作為全域性事務來管理。

系統經濟,可靠性高,可用性好:與一個大型 計算機支援一個大型的資料庫在加一些時程和遠端終端相比,由超級微型 計算機或超級小型計算機支援的分散式資料庫系統往往肯有更高的價效比和實施靈活性。分散式系統比集中式系統具有更高的可靠性和更好的可用性。

在一定條件下響應速度加快,如果存取的資料在本地資料庫中,那麼就可以使用者所在的計算機來執行,速度就快。

可擴充套件性好,易於整合現有系統,也易於擴充。

劣勢

通訊開銷大,故障率高。

資料的存取結構複雜。一般來說,分佈時資料庫中存取資料,比在集中時資料庫中存取資料更復雜,開銷更大。

資料的安全性和保密性較難控制。在具有高度場地自治的分佈時資料庫中,不同場的區域性資料庫管理員可以採用不同的安全措施,但是無法保證全域性資料都是安全的。安全性問題是分散式系統固有的問題。因為分散式系統是透過通訊網路來實現分佈控制的,而通訊網路本身去在保護資料的安全性和保密性方面存在弱點,資料很容易被竊取。

面臨挑戰

資料的分佈對資料的管理理出了更高的要求。分散式資料庫管理系統肯有管理分佈資料的功能,使使用者感覺不到資料是分佈的。即使用者不必知道資料是否分片、是否有副本、資料存放在哪個節點上以及事務在哪幾個節點上執行並能保證前後資料的一致性。

分散式資料庫系統就是分佈透明的。資料分杣策略的好環直接影響到分散式資料庫的效能。

 

以上為資料分佈(資料複製、資料分片及優劣勢), 「分散式技術專題」是國產資料庫 hubble 團隊精心整編,專題會持續更新,歡迎大家保持關注。

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026685/viewspace-2935119/,如需轉載,請註明出處,否則將追究法律責任。

相關文章