Apache ShardingSphere 首篇論文被 ICDE 收錄,全球資料庫發展迎來新局面
01 Apache ShardingSphere 論文被 ICDE 收錄
近日,由 Apache ShardingSphere 社群、SphereEx 以及重慶大學計算機系團隊共同撰寫的 “Apache ShardingSphere:A Holistic and Pluggable Platform for Data Sharding” 論文,被資料管理與資料庫國際頂級會議 ICDE 全文錄用,成為業界首篇關於資料分片的頂級會議論文。
ICDE(The International Conference on Data Engineering)是中國計算機協會(CCF)推薦的 A 類國際學術會議,是資料庫和資料探勘領域頂級學術會議之一,電氣與電子工程師協會(IEEE)的旗艦會議,和 SIGMOD、VLDB 並稱資料管理與資料庫領域的三大國際頂尖學術會議。
此次被收錄,代表 Apache ShardingSphere 所倡導 Database Plus 理念的工程化實踐,經過 5 年多的研發及生產驗證外,已經得到理論層面的驗證。其提出的基於資料庫之上的增強計算引擎,及內建的多層可插拔架構得到很好的印證。其研究成果獲全球頂會認可,也代表著 Apache ShardingSphere 在資料庫底層核心基礎性技術研究方面持續獲得了創新性突破。該論文印證了 關係型資料庫仍然是線上事務處理的主力,但缺乏可擴充套件性以及無法高效解決高併發問題,以及 NewSQL 資料庫會帶來額外學習成本的背景下,Apache ShardingSphere 作為一款資料庫中介軟體來連線和管理眾多已有的資料庫,已經成為一種十分友好且高效的方式。
02 驗證 Apache ShardingSphere 的科學發展路徑
Apache ShardingSphere 從誕生至今,已經走過了 6 年多時間。在旁觀者的視角看來,不論是專案本身或是開源社群,Apache ShardingSphere 都已經相當成功。
我們為什麼要完善現有的資料庫生態,而並非新建一款資料庫?
Apache ShardingSphere 旨在充分合理地在分散式的場景下利用關係型資料庫的計算和儲存能力,而並非實現一個全新的關係型資料庫。
時至今日,關係型資料庫作為支援完整事務的最優選擇,其仍然是線上事務處理的主力。但由於關係型資料庫在設計初期是針對單臺機器的,並沒有考慮到流量、資料過大時的場景,因此可擴充套件性欠佳並且無法高效解決高併發問題。在此背景下 NewSQL 應運而生,New 就意味著是從零開始開發的資料庫。雖然適合現在的應用場景,但其還沒有大量接受過真實生產環境的檢驗,並且還會為企業的維護人員帶來額外學習成本。
在此背景下,Apache ShardingSphere 也一步步從工具發展到生態,立足點越來越高,影響範圍越來越廣,這樣的系統打破了關係型資料庫架構的限制。目前,Apache ShardingSphere 已更新至 5.1.0 正式版。伴隨著此次更新,Apache ShardingSphere 也正式將產品定位轉向以 Database Plus 為核心的全新領域,旨在構建多模資料庫上層的標準和生態。 除在資料庫上層提供強大的增量能力之外,Database Plus 架構也為開發者和使用者開放了高度可擴充套件的資料庫生態,幫助使用者站在資料庫的上層視角,更多關注資料庫之間的協作。
Apache ShardingSphere 的多重特性
- 可插拔
Apache ShardingSphere 專案採用微核心 + 三層可插拔模型,使核心、功能元件以及生態對接完全能夠靈活的方式進行插拔式擴充套件,開發者能夠像使用積木一樣定製屬於自己的獨特系統。在 Apache ShardingSphere 的框架下,所有功能均可透過積木化的形式組裝到 ShardingSphere 體系中,且可以疊加使用。而在開發者面向標準的 SPI 程式設計中,核心對增量功能是無感知的,所以 ShardingSphere 在實際的應用場景中可以靈活組合多個功能模組,為使用者提供無限的想象空間。
此外,Apache ShardingSphere 是基於 SPI(Service Provider Interface,一種 Java 語言中的服務發現機制)和多種設計模式設計的。因此,更多型別的資料庫、功能、分片演算法都能夠非常方便地加入、移除以及自由組合。
其中,作為研發 ShardingSphere 的起源訴求,資料分片一直以來都是 ShardingSphere 的重要特性之一。對於許多使用者來說,分片功能也是其使用 ShardingSphere 的初期原因之一。綜合來看, 對關係型資料庫進行資料分片操作,以水平資料分片的方式突破單臺機器儲存量的限制,是基於現有情況下更適合於企業的解決方案。
- 高效能
論文中提到,重慶大學與 SphereEx 在 Sysbench 和 TPCC 這兩個測試環境下進行了多輪實驗,驗證了在相同的配置下 Apache ShardingSphere 的效能都優於大多數分片系統和新架構資料庫。詳細資料可參照下圖:
(Sysbench 測試結果)
(使用 TPCC 對不同分散式系統的比較)
03 結語
Apache ShardingSphere 目前已經在數百家海內外企業的生產環境中得到應用,涉及網際網路、遊戲、銀行、保險、證券、製造業、電信、新零售、政府等多個行業,已得到多個真實生產場景的驗證。
隨著本篇論文被 ICDE 收錄,也標誌著學術界對 Apache ShardingSphere 理念的認可,將會為資料庫行業發展、提升資料處理效能等方面提供新的解決思路,也為關係型資料庫應用分散式能力、可插拔架構的普及、資料庫上層生態的建設奠定了堅實的理論基礎。
透過本篇論文,希望 Apache ShardingSphere 在該領域下的探索可以啟發到其他資料庫領域的開發者與學者,共同繁榮資料庫生態,將資料庫打造為更加貼合業務場景的資料服務平臺而努力。
⏰ 論文原文後續將在公眾號及 ICDE 官方發出,歡迎大家關注。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70001955/viewspace-2884529/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 全球廠商之最,華為17篇論文入選國際資料庫頂會ICDE資料庫
- 百度15篇論文被AAAI 2019收錄AI
- 亮劍INTERSPEECH 2020,思必馳10篇論文被收錄
- 大資料基礎工程技術團隊4篇論文入選ICLR,ICDE,WWW大資料ICLR
- DistSQL:像資料庫一樣使用 Apache ShardingSphereSQL資料庫Apache
- ICDE 2022|Apache ShardingSphere:一個功能全面和可插拔的資料分片平臺Apache
- 阿里雲與達摩院合作 AHPA 彈性預測論文被頂會 ICDE 錄用阿里
- 京東城市6篇論文被KDD2019收錄,展示AI和大資料在智慧城市的落地應用AI大資料
- 全球分散式資料庫:Google Spanner(論文翻譯)分散式資料庫Go
- 基於 Apache ShardingSphere 構建高可用分散式資料庫Apache分散式資料庫
- 一文讀懂資料庫發展史資料庫
- Apache ShardingSphere 後設資料載入剖析Apache
- 京東雲與AI 10 篇論文被AAAI 2020 收錄,京東科技實力亮相世界舞臺AI
- 4篇論文入選資料庫頂會,騰訊雲突破資料庫效能瓶頸資料庫
- 騰訊天衍實驗室14篇論文獲MICCAI 2020收錄AI
- 自然語言處理工具HanLP被收錄中國大資料產業發展的創新技術新書《資料之翼》自然語言處理HanLP大資料產業新書
- 資料庫圈周盤點:圖資料庫相關報告發布;國內資料庫廠商多篇論文入選VLDB資料庫
- 從資料庫發展史看資料庫未來技術趨勢資料庫
- 一文讀懂資料庫70年發展史資料庫
- 【資料庫系統】資料庫系統概論====第十三章 資料庫技術發展資料庫
- 博文乾貨|Apache InLong 使用 Apache Pulsar 建立資料入庫Apache
- 分散式 SQL:資料庫的未來發展方向分散式SQL資料庫
- Oracle資料庫發展Oracle資料庫
- Webpack資料收錄Web
- 大資料未來發展大資料
- 華為雲資料庫創新發展論壇,打造行業更優資料庫底座!資料庫行業
- 國內首篇雲廠商 Serverless 論文入選全球頂會:突發流量下,如何加速容器啟動?Server
- 首發 | 曠視14篇CVPR 2019論文,都有哪些亮點?
- 資料庫圈周盤點:Instaclustr被收購;TiDB 6.0 發版資料庫TiDB
- 近期值得讀的10篇GAN進展論文
- PostgreSQL資料庫將迎來崛起時刻HYSQL資料庫
- 分散式資料庫技術之路未來如何發展?分散式資料庫
- 史上最大規模ACL大會放榜,百度10篇NLP論文被錄用
- Apache ShardingSphere:由開源驅動的分散式資料庫中介軟體生態Apache分散式資料庫
- 資料庫發展史(上)資料庫
- 資料庫發展史(中)資料庫
- 資料庫發展史(下)資料庫
- 又一創新!阿里雲 Serverless 排程論文被雲端計算頂會 ACM SoCC 收錄阿里ServerACM