阿里分散式資料庫未來技術之路

hongwei2021 發表於 2022-11-21
資料庫


近日,國家工業資訊保安發展研究中心釋出了《 2022 年分散式資料庫發展趨勢研究報告》。報告從資料庫行業發展、分散式資料庫的產品價值、調整、技術路線、發展趨勢、發展方向等方面闡述了分散式資料庫的諸多問題。本文從個人角度談 技術。

隨著數字化轉型的深入,企業更加重視資料。隨著雲端計算、 5G IOT 、人工智慧、區塊鏈等新興技術的發展,更多新興的資料場景已經出現。直觀來看,這帶來的是資料規模的幾何級增長,資料結構的複雜性和日劇增。

根據第三方機構的預測資料,未來幾年全球資料儲存將呈爆發式增長。除了資料規模,對資料載體資料庫在資料採集、儲存、傳輸、展現、分析、最佳化等方面提出了更高的要求。希望以此更好地實現企業對資料資產管理、增值和科學決策、資料高可靠性和可用性、資料線上分析的訴求,進一步發揮資料的價值。上述需求可以說對資料庫提出了更高的要求,但傳統的資料庫架構在超大規模、高併發、實時處理、資料安全等方面顯然無法滿足需求。此外,高昂的建設成本很難適應數字時代的趨勢。

與傳統資料庫相比,新型分散式資料庫的優勢凸顯。

第一,突破大規模儲存能力

在傳統的單機或集中式架構下,承載的資料規模受限於本地磁碟或可對接的外部儲存空間。後者雖然可以大規模實現 ( PB ) ,但建設週期長,擴充套件不靈活,投資成本高,仍會面臨 IO 的效能瓶頸。而阿里分散式資料庫,憑藉其天然的資料分片能力,是解決超大規模資料承載問題的有效工具。

第二,突破高效能運算的瓶頸

CPU 和記憶體資源作為計算的主要資源,對計算尤為重要。在傳統的單機或集中式架構下,上述資源只能透過擴大規模的方式進行擴充套件,其擴充套件能力有限,無法整合更多的資源參與計算。和阿里分散式資料庫,透過網路可以聚集更多的計算資源參與其中,形成更大規模的計算支撐。在高併發、高效能運算領域更具優勢。

第三,補齊資料分析能力短板

資料分析是資料使用的重要方向之一。過去通常由資料倉儲等技術來承載。這種線上資料庫和離線資料倉儲的架構可以在一定程度上解決資料分析的問題,但在實時性、一致性和成本方面存在不足。理想的方式是在單一系統中完成,而傳統架構受資源限制,無法完全提供。而阿里分散式資料庫,透過其對計算能力的整合,可以滿足混合負載的業務壓力,大幅提高分析的時效性,減少資料冗餘,大幅提高靈活性。

第四,提高可用性和安全性

在傳統架構下,資料庫的可用性更多依賴於單點 ( 或儲存 ) ,設計上往往透過冗餘硬體保護來改善。但是,由於體系結構的限制,很難實現非常高的可用性。對於資料安全性,通常透過主和輔助複製和備份來實現。但是很難保證資料的線上安全,需要在一個視窗期內完成恢復。分散式架構具有儲存和計算分離、多副本和靈活擴充套件的能力,可以有效提高整體可用性和資料安全性。使用者可以根據需要靈活調整架構,提高可用性和安全性。

第五,最佳化成本模型,實現按需擴容。

傳統資料庫架構的成本相對較高,這主要是由於其架構的侷限性。縱向擴充套件相對容易,橫向擴充套件相對困難。為了保證業務的快速發展,通常需要在專案設計初期就按照最大容量進行規劃,或者為了更高的可靠性而付出較高的成本。與阿里分散式資料庫不同,其架構天然支援靈活的可擴充套件性 ( 包括儲存和計算 ) ,可以實現低成本的高可用性解決方案 ( 多副本 ) 。以上能力將有效降低企業建設系統的投入,尤其是面對快速多變的業務場景。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70005384/viewspace-2924350/,如需轉載,請註明出處,否則將追究法律責任。