資料應用的變與不變,ShardingSphere 正在影響未來數字體驗的建設理念

SphereEx發表於2021-08-13

近年來關於底層資料庫的開源產品越來越多,它們也受到了許多資本的青睞。

伴隨著移動網際網路催生的數字化場景爆發,雲端計算、大資料等技術逐漸有了更加廣闊的應用場景。在雲端計算和大資料經過十年的追趕式發展後,不只是傳統行業,各家平臺自身也在面臨轉型升級。在這種轉折中,資料的使用、應用、場景等都發生了變化。

隨著大資料在各領域下的應用不斷得到擴張,一個平臺上的資料來源、價值、渠道、場景等都得到了分散和細化。以資料庫應用為代表的新一代基礎設施,在時下所要做的不是專注在某一個種類、場景下的資料收益,而是需要對這些『散亂』的資料進行重構。

從本地私有化到雲端,從單點到分散式,資料庫領域得到了前所未有的延伸。雲上資料庫和分散式資料庫,也共同構成了當今資料庫市場中最熱的兩條賽道。

而 SphereEx,正是要在這兩條賽道上做出更多創新的能力。

SphereEx 聯合創始人潘娟認為,資料的價值在於感知和應用,平臺只是承載資料的形式。無論傳統關係型資料庫還是分散式資料庫,其連線應用和資料的本質都不會變。關鍵在於是否能滿足具有高併發、大規模資料儲存、業務快速擴張等特徵的使用者業務對資料庫的要求。


0 1
以可插拔架構為切口,探索多源資料的統一管理軌跡

毫無疑問,分散式資料庫是當前最火的資料庫領域,但傳統關係型資料庫仍然佔據了市場的主流,且由於應用場景的細分,將在未來相當長一段時間保持現在的態勢,難以出現資料庫大一統的局面。

經過數十年的發展,資料庫本身的生態和能力已經十分完善,已經存在很多效能強大的資料庫,所分佈的場景和領域也已經十分垂直。在資料庫選型方面,圍繞業務重心來選擇最適配的資料庫產品,已經成為技術團隊中非常重要的一項工作。

不過,關係型資料庫仍然是全球的主流。近日,DB-Engines 釋出了 2021 年 8 月份的資料庫排名,Oracle、MySQL、SQLServer 依然排在前三位,關係型資料庫依然擁有龐大的使用者生態和強大的話語權。不過關係型資料庫在“可擴充套件性、高併發以及效能”方面,存在非常多的問題,比如:傳統的關係型資料庫以及二維關係模型,很難高效地擴充套件到多個儲存節點上。

在這種背景下,傳統關係型資料庫難以支撐起高併發的資料體量,但業務場景又需要資料庫具備這種能力,分散式資料庫成為了熱門的選擇。

在潘娟看來, 無論資料庫市場如何風雲變幻,其本質依然是透過對資料實現多型別檔案的管理與儲存,在本質不變的前提下,發生變化的也只是場景和效益。 因此對於 ShardingSphere 和 SphereEx 來說,底層是怎樣的資料庫都無所謂,畢竟只是管理和儲存的空間, ShardingSphere 將在資料庫上層開闢一條統一的管理平臺,在資料庫上層生態發現更多可能。

因此面對技術選型和資料庫應用層面的差異化,ShardingSphere 避免因資料庫所產生的侷限性,在資料庫上層進行能力整合,將更多元的資料庫包含進來,對資料庫上層實現能力管控,將多款不同的資料庫包含進同一種事務語義中。

僅僅提供對應用和資料的連線是遠遠不夠的。

潘娟認為,對於未來資料庫的發展,應該分為兩個視角。一個是底層資料庫的發展趨勢,另一個則是資料庫與應用之間的平臺發展趨勢。沿著這一發展趨勢,就能發現 SphereEx 所做的事情,將其歸納為 Database Plus 產品。

目前,ShardingSphere 正在向著 Database Plus 產品形態去演進。作為一個完全面向廣度的生態類專案,SphereEx 公司正在主導把 ShardingSphere 打造成為 Database Plus 的產品形態,致力於搭建資料庫上層的標準化增量,而非重新做一個 n+1 的資料庫。在 Database Plus 產品之上,開發了一套足夠靈活的可插拔架構體系,基於可插拔平臺的疊加機制,對分片、讀寫分離、加解密、加密+分片等功能進行排列組合,提供面向應用與資料的增強與擴充服務。


0 2
雲上,構建新的資料庫設計正規化

隨著同為網際網路基礎設施的雲端計算發展勢頭依然迅猛,企業在雲上的業務比重也逐年升高,業務、資料、資料庫上雲已經是不可逆的趨勢。作為資料庫上層的服務平臺,ShardingSphere 未來肯定也將從雲下遷移到雲上,為使用者提供 SaaS 化服務,幫助企業更快速、更方便地上雲。

但是 ShardingSphere 所提供的 SaaS 服務,是不同於傳統意義上的模式, 而是以資料網格的形式,遵循 Database Mesh 的理念來踐行。 潘娟認為 Database Mesh 理念可以在企業雲原生資料庫落地方面起到有效的輔助作用。作為 ShardingSphere 在雲端的應用形態, 未來 ShardingSphere 會透過提供 Sidecar 來管理雲上的南北流量,讓業務應用透過 Sidecar 導流到 Proxy 端,再導流到資料庫,形成使用者無感知的資料穿透能力。 在這層能力之上,ShardingSphere 可提供如資料路由,讀寫分離,資料加解密等增量服務,並透過明確 Proxy 的資料標籤,並能夠根據當前的 SQL 特徵來路由到合適的 Proxy 端,進而實現面向東西+南北流量的共同治理。

雖然服務形式類似於 Service Mesh 服務網格,但 Database Mesh 能夠深度理解 SQL 的含義,從而進行更細粒度的掌控。

另一方面,雲上的資料庫往往會承擔更多來自使用者、流量側的壓力,加之業務會比以往更加頻發地訪問資料庫,很多使用者會擔心 Sidecar 這種形式會影響到資料庫的效能。由於 ShardingSphere 是執行在資料庫之上的服務,或多或少會對資料庫的效能產生影響,但終歸是要使用者來評估在『犧牲一部分效能後,能夠得到什麼』。

由於 Sidecar 對於應用而言不會產生跨網路節點,從 Sidecar 到資料庫之間才會產生,因此從應用體驗層面來看,透過 Sidecar 來訪問資料庫和直接訪問資料庫這兩個方式之間不存在特別大的區別;但如果涉及到核心計算,就需要使用者來衡量是否需要用資源來換取時間。在 ShardingSphere 中,使用者可以選擇將計算過程跳過 Sidecar,落在 Proxy 上進行統一計算,完成後將結果返回,避免單獨計算每個應用所造成的大量時間的浪費,使應用更方便連線到相關的資料庫。

作為新時代數字經濟的基礎設施之一,資料庫承載著網際網路過去以來發展的記憶。作為資料的底座,不論承載資料的形式是怎樣的,應用資料最終的目的和導向性都是一致的,區別只在於如何應用。而應用資料的過程,也直接反映了當下網際網路行業變遷的過程。 在合適的時機選擇恰當的資料使用方式,才能讓企業始終保持在符合網際網路行業變遷規律之上進行發展。


歡迎掃碼關注我們



來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70001955/viewspace-2786845/,如需轉載,請註明出處,否則將追究法律責任。

相關文章