Flink sql 之兩階段聚合與 TwoStageOptimizedAggregateRule（原始碼分析）

ljygz發表於2022-01-06

原文網址 : https://www.cnblogs.com/ljygz/p/15771889.html

SQLZed原始碼

本文原始碼基於flink1.14

上一篇文章分析了《flink的minibatch微批處理》的原始碼

乘熱打鐵分析一下兩階段聚合的原始碼，因為使用兩階段要先開啟minibatch，至於為什麼後面會分析到

兩階段聚合的原理，還是簡單提一下

如下圖，當聚合發生熱點的時候，可以在聚合前，先進行一個本地的聚合，先減小資料量，後接正常的資料交換以後聚合，來達到一個解熱點的目的，

先來看下兩階段聚合的Calcite優化rule

看下什麼情況會匹配上

並且在onmatch方法中會判斷開啟了minibatch，以及二階段聚合的時候會呼叫

來看下具體邏輯match方法

整個兩階段聚合會將原來的一個StreamPhysicalGroupAggregate物理節點，轉換成一個

StreamPhysicalLocalGroupAggregate本地聚合節點 + StreamPhysicalGlobalGroupAggregate聚合節點

來看下這個新新增的StreamPhysicalLocalGroupAggregate本地聚合運算元的計算邏輯是什麼樣子的

StreamExecLocalGroupAggragate就是StreamPhysicalLocalGroupAggregate本地聚合具體的ExecNode節點了

來看下具體的operator

看到這裡是不是看到了熟悉的 MapBundleOperator ，如果看過上一篇minibatch優化的就知道，兩階段提交也是使用的這個有界operator作為抽象

在瞭解一下這個MapBundleOperator

就是每來一條資料，都會呼叫傳入的fun的addInput方法

然後把每個key的結果put儲存在一個本地變數，就是個map<Rowdata,Rowdata>裡面

然後呼叫自己的trigger觸發器，當這條資料可以觸發觸發器就會呼叫finishBundle

這裡說到觸發器，回到初始化mapBundle的時候通過createMiniBatchTrigger建立的一個minibatch的觸發器，看看具體邏輯

其實就是一個普通的count觸發器，觸發條件就是直接使用的minibatch配置的size引數, 所以這裡知道了為什麼兩階段提交要先開minibatch了

先看下每來一條資料會觸發的addInput方法，在來看看攢一個批次後觸發的finishBundle

minibatch會包裝成一個MiniBatchLocalGroupAggFunction這個funtion的addInput來看看

就是來一條資料直接呼叫聚合函式的accumulate直接計算結果了，雖然計算結果但是還沒有往下游傳送

來看下當攢一批後，集體是怎麼往下游傳送的 finishBundle 方法

結果都已經計算好了，攢一個批次還能幹嘛，就是把當前的計算結果往下游傳送唄

那整個二次聚合的優化就講完了

總結一下

sql會將agg拆成 localminiagg + agg

先在本地聚合localConbine一遍，再往下游傳送

下游就正常聚合，優化了熱點的問題

Flink SQL之Over 聚合操作
2022-06-28
SQL
[Flink-原始碼分析]Blink SQL 回撤解密
2021-12-26
原始碼SQL解密
Guava 原始碼分析（Cache 原理【二階段】）
2019-03-02
Guava原始碼
MapReduce —— MapTask階段原始碼分析（Input環節）
2021-06-10
APT原始碼
MapReduce —— MapTask階段原始碼分析（Output環節）
2021-06-11
APT原始碼
mysql之事務prepare 與 commit 階段分析
2018-10-25
MySqlMIT
Spark SQL原始碼解析（四）Optimization和Physical Planning階段解析
2020-05-14
SparkSQL原始碼
Spark SQL原始碼解析（五）SparkPlan準備和執行階段
2020-05-27
SparkSQL原始碼
[原始碼解析] GroupReduce，GroupCombine 和 Flink SQL group by
2020-06-16
原始碼SQL
[原始碼分析] 帶你梳理 Flink SQL / Table API內部執行流程
2020-04-25
原始碼SQLAPI
Shading – jdbc 原始碼分析(三) – sql 解析之 Select
2019-02-25
JDBC原始碼SQL
嵌入式之uboot原始碼分析-啟動第二階段學習筆記（上篇）
2020-12-02
boot原始碼筆記
分散式事務（二）之兩階段提交
2021-10-21
分散式
[Mysql]兩階段提交
2024-08-19
MySql
《Flink SQL任務自動生成與提交》後續：修改flink原始碼實現kafka connector BatchMode
2022-01-12
SQL原始碼KafkaBAT
React原始碼解析之Commit第一子階段「before mutation」
2020-04-04
React原始碼MIT
Guava 原始碼分析之 EventBus 原始碼分析
2018-08-01
Guava原始碼
Android 原始碼分析之 AsyncTask 原始碼分析
2019-03-04
Android原始碼
Apache Flink原始碼分析---JobManager啟動流程
2020-09-29
Apache原始碼
兩階段終止模式
2021-06-08
模式
Redux 高階 -- 原始碼分析
2018-04-25
Redux原始碼
3 SQL 聚合與排序
2018-10-18
SQL排序
Flink 非對齊Unaligned的checkpoint（原始碼分析）
2022-01-12
原始碼
[原始碼解析] 深度學習流水線並行之PopeDream(1)--- Profile階段
2021-09-01
原始碼深度學習並行
[原始碼分析]從"UDF不應有狀態" 切入來剖析Flink SQL程式碼生成 (修訂版)
2020-04-29
原始碼SQL
08 MySQL兩階段認證
2021-10-09
MySql
vitess兩階段提交事務
2021-09-09
Vite
原始碼分析之 HashMap
2019-03-04
原始碼HashMap
原始碼分析之 LinkedList
2019-01-23
原始碼
Shading – jdbc 原始碼分析(四) – sql 路由
2019-03-02
JDBC原始碼SQL路由
原始碼|jdk原始碼之HashMap分析(一)
2019-01-19
原始碼JDKHashMap
原始碼|jdk原始碼之HashMap分析(二)
2019-01-19
原始碼JDKHashMap
兩階段提交2PC 和三階段提交3pc
2019-02-18
分散式：分散式事務（CAP、兩階段提交、三階段提交）
2021-12-23
分散式
精盡MyBatis原始碼分析 - SQL執行過程（一）之 Executor
2020-11-24
MyBatis原始碼SQL
精盡MyBatis原始碼分析 - SQL執行過程（二）之 StatementHandler
2020-11-25
MyBatis原始碼SQL
精盡MyBatis原始碼分析 - SQL執行過程（三）之 ResultSetHandler
2020-11-25
MyBatis原始碼SQL
mysql兩階段提交和組提交
2020-06-06
MySql

Flink sql 之 兩階段聚合與 TwoStageOptimizedAggregateRule（原始碼分析）

相關文章

Flink sql 之兩階段聚合與 TwoStageOptimizedAggregateRule（原始碼分析）