三篇論文入選國際頂會SIGMOD,厲害了騰訊雲資料庫

騰訊雲資料庫 發表於 2022-06-14
資料庫 騰訊

好訊息!6月13日,騰訊雲資料庫三篇論文再次入選資料庫行業頂會SIGMOD,被SIGMOD 2022 Research Full Paper(研究類長文)收錄。

本次被收錄的研究成果中,新型資料結構設計、AI智慧調參優化等均屬於業界首次提出。騰訊雲資料庫多次入選SIGMOD,表明騰訊雲資料庫在儲存、智慧管控等方面的積累與前沿創新獲得了國際權威認可。

file

SIGMOD,全稱資料管理國際會議(Special Interest Group on Management Of Data),是由美國計算機協會(ACM)資料管理專業委員會(SIGMOD)發起、在資料庫領域具有最高學術地位的國際性學術會議。

第一篇入選論文題目為HUNTER: An Online Cloud Database Hybrid Tuning System for Personalized Requirements,由騰訊雲資料庫團隊和華中科技大學合作完成,在AI智慧調參優化上取得進一步突破。

通俗理解,資料庫的引數設定多達幾百個,這些引數控制著資料庫的效能表現。專業運維人員會花大量時間,根據經驗來調優資料庫的引數,以匹配不同硬體、需求和業務場景。如何利用 AI 技術解決資料庫系統效能問題變得越來越重要和緊迫。

在此篇論文中,騰訊雲資料庫TDSQL-C團隊提出了混合調優系統Hunter,主要解決了如何在保證調優效果的前提下顯著減少調優時間的問題。實驗表明:隨著併發度提升實現調優時間準線性降低,在單併發度場景下調優時間只需17小時,在20併發度場景下調優時間縮短至2小時。

第二篇入選論文由中國人民大學和騰訊雲資料庫團隊合作完成,題為CompressDB: Enabling Efficient Compressed Data Direct Processing for Various Databases,論文針對壓縮資料的直接操作與處理,提出一項新型資料庫處理技術——CompressDB。

面對當下指數級增長的資料量,行業普遍使用資料壓縮來減少儲存空間。在大資料管理系統中,直接在壓縮資料上進行操作,可以獲得儲存空間的節約和處理效能的提升。但是,當前的此類系統只關注資料查詢,而一個完整的大資料管理系統必須支援資料查詢和資料操作。

本研究提出並實現了新型資料庫技術,利用上下文無關文法來壓縮資料,通過新的資料結構和演算法設計實現對語法規則進行解析,CompressDB支援直接對壓縮後的資料進行資料查詢和操作,並且支援各種資料庫系統。實驗表明,CompressDB 平均達到40%的吞吐量提升和44%的延遲縮短,並實現1.81倍的壓縮率。

第三篇入選論文由騰訊和北京大學合作完成,題為 BlindFL: Vertical Federated Machine Learning without Peeking into Your Data。針對資料隱私安全問題,該論文提出了一個新的縱向聯邦學習正規化BlindFL,可支援多種特徵資料型別,且可以在半誠實安全假設下證明其安全性。實驗結果表明,BlindFL可有效保護參與方的隱私資料,並具有更高的執行效率。

騰訊歷來重視資料庫領域的研發,通過校企聯合實驗室共建,面向青年學者的CCF-騰訊犀牛鳥基金,騰訊犀牛鳥科研專項等與高校、科研機構構建“產學研”一體的長期合作,將技術研究成果轉換為應用落地,校企聯合持續輸出前沿技術創新與示範性應用。

此前,騰訊雲資料庫TDSQL曾多次亮相資料庫三大頂會SIGMOD、ICDE、VLDB,以及資料科學領域的頂級期刊IEEE TKDE等。騰訊雲資料庫TDSQL將繼續加大對資料庫基礎研究創新、資料庫產學研合作生態的建設投入,充分釋放領先技術的紅利,助力國產資料庫學術人才培養和技術創新生態建設發展。

為幫助廣大資料庫愛好者更加詳細地瞭解論文內容,我們邀請到了中國人民大學副教授、博士生導師、騰訊犀牛鳥基金獲得者張峰老師,華中科技大學副研究員、網際網路+國賽金獎專案“資料庫智慧管家的創新與探索”指導老師劉渝及騰訊 TEG 機器學習平臺部 Angel Graph 團隊應用研究員、北京大學計算機系在讀博士生張文濤老師來到直播間解讀。6 月 21 日 15:00,不見不散!

掃描海報二維碼或點選閱讀原文,即刻報名參會!

file