Blaze:基於Rust加速器用更少資源加速Spark作業
超快的查詢執行引擎使用 Apache Spark 語言,並以 Arrow-DataFusion 為核心。
Apache Spark 的 Blaze 加速器利用本機向量化執行來加速查詢處理。它結合了Apache Arrow-DataFusion庫的強大功能和 Spark 分散式計算框架的規模。
Blaze 從 Spark 獲取一個完全最佳化的物理計劃,將其對映到 DataFusion 的執行計劃中,並在 Spark 執行器中執行本機計劃計算。
Blaze 由以下高階元件組成:
- Blaze Spark 擴充套件:將整個加速器連線到 Spark 執行生命週期中。
- Native Operators:定義每個 SparkPlan 如何對映到其本機執行對應項。
- JNI 閘道器:透過 JNI 邊界傳遞資料和控制。
- Plan SerDe:使用 protobuf 對 DataFusion 計劃進行序列化和反序列化。
- Columnarized Shuffle:以 Arrow-IPC 格式組織的 shuffle 資料檔案。
基於 DataFusion 固有的明確定義的可擴充套件性,Blaze 可以輕鬆擴充套件以支援:
- 各種物件儲存。
- 運營商。
- 簡單和聚合函式。
- 檔案格式。
相關文章
- Web靜態資源加速Web
- 基於APK加速啟動時間的Android系統資源優化APKAndroid優化
- stardust-oxide:基於Rust的開源迷你作業系統UnikernelIDERust作業系統
- Redox OS:基於Rust的作業系統Rust作業系統
- 火山引擎基於 Dragonfly 加速實踐Go
- BEVFormer-accelerate:基於EasyCV加速BEVFormerORM
- 基於龍蜥作業系統指令加速,降低雲原生閘道器的構建成本作業系統
- 基於SRAM的方法可加速AI推理AI
- SBT 配置映象加速源
- 基於暫存器呼叫的軟體加速
- 關於Docker加速映象Docker
- 加速和簡化構建Docker(基於Google jib)DockerGo
- 使用PyO3從Python呼叫 Rust:加速PythonPythonRust
- yarn 國內加速,修改映象源Yarn
- Composer 國內加速,修改映象源
- NPM 國內加速,修改映象源NPM
- 世界資源研究所:加速氣候韌性基礎設施建設
- 加速國產化替代,跑出信創產業“加速度”產業
- 開源資料庫商業化加速,雲端計算助推開源軟體發展資料庫
- 基於 Fluid+JindoCache 加速大模型訓練的實踐UI大模型
- 網易蜂巢:基於容器和微服務迭代加速實踐微服務
- 全民加速節:全站加速在遊戲行業的最佳實踐遊戲行業
- Hummingbird - WordPress快取、靜態資源合併、加速外掛快取
- (資料科學學習手札150)基於dask對geopandas進行並行加速資料科學並行
- 阿里雲CDN不止於加速:基於https**演算法構建安全資料傳輸鏈路阿里HTTP演算法
- Mongodb 使用國內源為安裝加速MongoDB
- 浪潮儲存基於智慧運維技術,加速儲存自治運維
- 強生加速創新醫療資源惠及基層,支援共同富裕築就健康基石
- 基於 Spark 的資料分析實踐Spark
- ravynOS 0.5.1 - 基於 FreeBSD 的 macOS 相容開源作業系統Mac作業系統
- Composer 加速
- docker加速Docker
- snap加速
- 光纖加速卡設計資料第410篇:基於XCVU9P+ C6678的40G光纖的加速卡
- 基於英特爾® Gaudi® 2 AI 加速器的文字生成流水線AI
- 基礎軟體打造企業數字化轉型加速引擎
- 網站動靜加速架構 dcdn+ga 全站加速和全球加速api網站架構API
- 阿里巴巴開源容器映象加速技術阿里