Blaze:基於Rust加速器用更少資源加速Spark作業
超快的查詢執行引擎使用 Apache Spark 語言,並以 Arrow-DataFusion 為核心。
Apache Spark 的 Blaze 加速器利用本機向量化執行來加速查詢處理。它結合了Apache Arrow-DataFusion庫的強大功能和 Spark 分散式計算框架的規模。
Blaze 從 Spark 獲取一個完全最佳化的物理計劃,將其對映到 DataFusion 的執行計劃中,並在 Spark 執行器中執行本機計劃計算。
Blaze 由以下高階元件組成:
- Blaze Spark 擴充套件:將整個加速器連線到 Spark 執行生命週期中。
- Native Operators:定義每個 SparkPlan 如何對映到其本機執行對應項。
- JNI 閘道器:透過 JNI 邊界傳遞資料和控制。
- Plan SerDe:使用 protobuf 對 DataFusion 計劃進行序列化和反序列化。
- Columnarized Shuffle:以 Arrow-IPC 格式組織的 shuffle 資料檔案。
基於 DataFusion 固有的明確定義的可擴充套件性,Blaze 可以輕鬆擴充套件以支援:
- 各種物件儲存。
- 運營商。
- 簡單和聚合函式。
- 檔案格式。
相關文章
- Web靜態資源加速Web
- Redox OS:基於Rust的作業系統Rust作業系統
- 基於APK加速啟動時間的Android系統資源優化APKAndroid優化
- stardust-oxide:基於Rust的開源迷你作業系統UnikernelIDERust作業系統
- 基於龍蜥作業系統指令加速,降低雲原生閘道器的構建成本作業系統
- 紅旗Linux作業系統加速(轉)Linux作業系統
- 基於SRAM的方法可加速AI推理AI
- 火山引擎基於 Dragonfly 加速實踐Go
- wordpress 加速主題的靜態資源
- 基於暫存器呼叫的軟體加速
- LaravelS - 基於 Swoole 加速 Laravel/Lumen - 帶你飛 ?Laravel
- 在Apache Hadoop和Spark上加速大資料加密 [session]ApacheHadoopSpark大資料加密Session
- 關於Docker加速映象Docker
- 加速啟動WindowsXP作業系統的謬論(轉)Windows作業系統
- 開源資料庫商業化加速,雲端計算助推開源軟體發展資料庫
- 全民加速節:全站加速在遊戲行業的最佳實踐遊戲行業
- 加速啟動Win XP作業系統的謬論(轉)作業系統
- 世界資源研究所:加速氣候韌性基礎設施建設
- 網易蜂巢:基於容器和微服務迭代加速實踐微服務
- 加速和簡化構建Docker(基於Google jib)DockerGo
- 使用PyO3從Python呼叫 Rust:加速PythonPythonRust
- 使用阿里DOCKER映象加速器加速阿里Docker
- Mongodb 使用國內源為安裝加速MongoDB
- 浪潮儲存基於智慧運維技術,加速儲存自治運維
- 使用 Rational 加速基於 XML 的 SOA 的 JSF 開發二XMLJS
- 基於 Fluid+JindoCache 加速大模型訓練的實踐UI大模型
- 加速 WebpackWeb
- docker加速Docker
- 基礎軟體打造企業數字化轉型加速引擎
- IOS 特定於裝置的開發:基於加速計的滾動檢視iOS
- 流媒體行業加速發展行業
- 安全加速!遊戲企業「增」量有道遊戲
- (資料科學學習手札150)基於dask對geopandas進行並行加速資料科學並行
- 資料築基,西湖大學加速國際前沿學科研究
- 使用阿里雲的Maven倉庫加速Spark編譯過程阿里MavenSpark編譯
- 加速的科大訊飛,加速的AI落地時代AI
- 工業大資料加速融合AI向智慧發展PUK大資料AI
- 工業大資料加速融合AI向智慧發展ZTXR大資料AI