今日獲悉,騰訊雲資料庫2篇論文入選國際資料庫頂級會議ICDE。其分散式事務協議——Lion和記憶體-磁碟跨越索引設計框架,解決了資料庫領域的普遍難題,技術創新獲得國際權威認可。
(騰訊雲資料庫團隊在ICDE會場進行技術分享)
據悉,ICDE(IEEE International Conference on Data Engineering)是資料庫研究領域歷史悠久的國際會議,與SIGMOD、VLDB並稱資料庫三大頂級會議,也是中國計算機學會(CCF)推薦的A類國際會議,主要聚焦設計、構建、管理和評估高階資料密集型系統和應用等前沿研究問題。
如今,分散式資料庫已成為企業儲存和管理海量資料的重要工具,在分散式事務處理過程中,常常涉及多輪跨節點的通訊,處理速度較慢。過去為提高效能,業內多透過遷移將分散式事務轉換為單節點事務。但基於遷移的方法可能會因等待資料遷移而導致事務被阻塞,而超級節點可能會成為瓶頸。
此次,騰訊雲和中國人民大學合作入選ICDE的論文《Lion: Minimizing Distributed Transactions through Adaptive Replica Provision》,則為這一難題提出了一種新穎的事務處理協議——Lion。作為一種自適應的副本放置機制,Lion利用基於分割槽的複製來減少分散式事務的發生。該機制增強了基於LSTM的工作負載預測演算法,以確定定位共同訪問分割槽的副本的適當節點。透過採用這種自適應副本放置策略,可以確保大多數事務可以在單個節點上高效處理,而無需額外的開銷。因此,Lion有效地最小化了分散式事務,同時避免了由資料遷移或超級節點的建立引起的任何中斷。大量實驗結果顯示,Lion與各種先進的事務處理協議相比,吞吐量提高了最多2.7倍、可擴充套件性提高了76.4%。
ICDE評審委員會也對論文研究成果給予了高度認可,認為Lion所提出的調整策略考慮了歷史資訊和未來工作負載的變化,並經過全面性評估實驗,不僅可顯著提高分散式資料庫系統的吞吐量,技術先進性還在大部分情況下超越了資料遷移技術、不對稱複製方法和確定性方法等。
另外,針對資料庫系統中,索引可能會消耗大量記憶體而無法完全存放的難題,騰訊雲聯合德州大學阿靈頓分校,在入選ICDE論文《IndeXY: A Framework for Constructing Indexes Larger than Memory》中,提出了名為IndeXY的記憶體-磁碟跨越索引設計框架。該框架解耦了索引記憶體部分和磁碟部分的設計,精心設計記憶體部分向磁碟的選擇性解除安裝並最佳化了磁碟重新載入索引並保留在記憶體的策略,以最大化最佳化記憶體訪問機會和效率。
該框架允許單獨採用一個記憶體索引設計,以及一個被認為最適合其工作負載的磁碟資料組織和訪問方案,實驗顯示,這一設計可將TPC-C工作負載提高高達8.6倍的吞吐量,且可以提高几乎所有YCSB工作負載的效能。
ICDE評審委員會認為,該論文解決了Index在記憶體索引必須溢位到磁碟時索引效率的關鍵問題,為企業提供了一個可按需選擇的組合方案(任何基於記憶體的索引IndeX+任何基於磁碟的索引IndeY),且記憶體和磁碟上的索引都可以單獨進行最佳化。
作為國產資料庫行業的先行者,騰訊雲至今已經深耕資料庫領域十餘年,服務客戶數超過50萬,覆蓋金融、政府、電商、遊戲等眾多行業。未來,騰訊雲也將持續創新技術,打磨產品和解決方案,為更多企業提供高可靠、高可用、高安全的資料庫服務,加速企業數字化升級與業務創新。