“初雪”與“向量化”| StarRocks Hacker Meetup小記

雲端計算頻道發表於2021-11-10

  StarRocks Hacker Meetup是StarRocks社群組織的面向開發者的線下活動,旨在透過面對面的交流幫助開發者深入瞭解StarRocks核心功能的實現原理,和開發者共同探討資料庫領域的前沿技術。

  第一季Hacker Meetup共4期,將持續2個月,每兩週探討一個StarRocks的核心功能。歡迎大家持續關注。第二期Hacker Meetup將在11月20日與大家見面!

  上週六,北京迎來了2021年的初雪。StarRocks社群也迎來了第一期Hacker Meetup:向量化程式設計的精髓。儘管雨雪交加,但開發者們熱情不減,現場座無虛席。小夥伴們對這次的活動都感覺收穫滿滿:

   乾貨回顧

  在本次Meeup上,康凱森同學深入淺出的從幾個方面向大家介紹了資料庫向量化程式設計的要點:

  ·How to build a fast database

  如何構建一個效能卓越的資料庫?凱森分別從預處理VS現場處理、架構、資料流、系統資源4個角度進行了回答。

  ·The basics of CPU vectorization

  凱森用Top-down的效能分析方法介紹了影響CPU效能的關鍵點,然後介紹了CPU向量化的基本概念和6種向量化程式設計的方式。

  ·The key points of database vectorization

  資料庫的向量化不僅僅是CPU指令的向量化,而是一個巨大的效能最佳化工程。凱森首先介紹了資料庫向量化的關鍵點:資料組織方式、運算元和表示式的向量化,SIMD如何加速Filter、Agg和Join,然後透過具體例項介紹了資料庫單核CPU效能最佳化的幾個關鍵點:資料結構和演算法、自適應策略、SIMD最佳化、記憶體管理最佳化、C++ Low Level最佳化和CPU Cache最佳化等,最後推薦了一些好用的效能最佳化工具。

  ·Thinking of StarRocks vectorization

  凱森介紹了StarRocks向量化工程的一些思考和總結。

  即使頂著風雪也要相見的開發者們,期待下次相聚!

   下期預告

  資料驅動的前提是能夠快速、準確地獲取和分析資料。為了滿足業務日益增長的實時更新需求,StarRocks重新設計並開發了儲存引擎,在保持查詢效能不受影響的前提下支援實時更新,並在單表簡單查詢下獲得了10倍以上的效能提升。

  下一期,將由StarRocks核心研發、Apache Kudu PMC常冰琳帶來【列式儲存中實時更新與查詢效能如何兼得】。本次Meetup,冰琳會詳細解讀StarRocks 2.0版本中最新發布的實時更新引擎,快快掃描下方海報二維碼報名,一起來一探究竟吧!

  時間:2021年11月20日14:00-17:00

  地點:拓荒族三層(中關村創業大街10號樓)

  演講嘉賓:常冰琳(StarRocks核心研發,Apache Kudu PMC)

  *受疫情影響的原因,本次Meetup入場券有限,先到先得。社群將會稽核您的報名資訊,StarRocks專案的Contributor擁有優先透過權,請以報名成功的簡訊通知為準。

  這個冬天,讓StarRocks陪你盡數領略技術之美!


來自 “ 廠商稿 ”, 原文作者:廠商稿;原文連結:無,如有侵權,請聯絡管理員刪除。

相關文章