Flink 自定義維表

新手路上的程式設計師發表於2019-05-07

原文網址 : https://blog.csdn.net/yidan7063/article/details/89920935

寫這個部落格主要是看了袋鼠雲的flinkStreamSQL git地址:https://github.com/DTStack/flinkStreamSQL 自己還往上提交了kudu的sink和side 第一次commit到github上面還是很開心的。

這裡重點說的是flinkStreamSQL是如何完成side的，主要其實是兩種快取方案LRU和ALL。這裡忽略所有的sql解析註冊等等，單純的從流的角度完成維表join。

ALL相對比較簡單先介紹ALL:
從KuduAllReqRow開始，這裡是維表的載入以及如何join。先檢視繼承關係，只看需要關心的。先看AllReqRow，AllReqRow只需要關心open()方法。這裡是同步快取，快取完畢後資料才繼續往下走。

     @Override
    public void open(Configuration parameters) throws Exception {
        super.open(parameters);
        //初始化全量維表資料
        initCache();
        System.out.println("----- all cacheRef init end-----");

        //start reload cache thread
        SideTableInfo sideTableInfo = sideInfo.getSideTableInfo();
        //建立執行緒池 開啟排程執行緒 每隔一段時間查詢全量資料 覆蓋原有資料
        es = Executors.newSingleThreadScheduledExecutor(new DTThreadFactory("cache-all-reload"));
        es.scheduleAtFixedRate(() -> reloadCache(), sideTableInfo.getCacheTimeout(), sideTableInfo.getCacheTimeout(), TimeUnit.MILLISECONDS);
    }

這裡其實就是主要的思想了，開啟一個排程執行緒不停的去查詢資料然後快取。這裡快取用的是
AtomicReference<Map<String, List<Map<String, Object>>>> cacheRef = new AtomicReference<>();
第一個string: join的條件 List:維表中本條資料的欄位名欄位值

以此條sql為例
insert into  MyResult
    select m.id,m.title,m.amount,s.tablename1
	from MyTable m  left join sideTable s on m.id=s.id ;

從streamAPI角度就是 MyTable流來了根據m.id的值去Map中查詢是否存在對應的List，如果存在則根據欄位名取出對應的值拼接到MyTable流中。

LRU: 主要是在SideAsyncOperator類中主要方法getSideJoinDataStream()

    public static DataStream getSideJoinDataStream(DataStream inputStream, String sideType, String sqlRootDir, RowTypeInfo rowTypeInfo,  JoinInfo joinInfo,
                                            List<FieldInfo> outFieldInfoList, SideTableInfo sideTableInfo) throws Exception {
        AsyncReqRow asyncDbReq = loadAsyncReq(sideType, sqlRootDir, rowTypeInfo, joinInfo, outFieldInfoList, sideTableInfo);
        //TODO How much should be set for the degree of parallelism? Timeout? capacity settings?
        return AsyncDataStream.orderedWait(inputStream, asyncDbReq, 10000, TimeUnit.MILLISECONDS, asyncCapacity)
                .setParallelism(sideTableInfo.getParallelism());
    }

依然只看需要關注的類:

可以看到這裡是用的非同步IO查詢，這裡的查詢是根據on後的條件，還是上面的邏輯程式碼傳入m.id=3 此時就會到資料庫中查詢s.id=3的資料快取到Cache<String, CacheObj> cache中 String是存入的值如 3，CacheObj= new CacheObj(type, content) type為列舉欄位MissVal(為查詢到資料),SingleLine(查詢的資料只會有一條(1對1)),MultiLine(查詢的資料有多條(1對多)) 。content為Object，如果是MultiLine 則表明content中需要存入多個資料。
快取時間:

 cache = CacheBuilder.newBuilder()
                .maximumSize(sideTableInfo.getCacheSize())
                .expireAfterWrite(sideTableInfo.getCacheTimeout(), TimeUnit.MILLISECONDS)
                .build();

在初始化Cache<String, CacheObj> cache時已經決定了快取的大小和時間。
從streamAPI角度就是 MyTable流來了根據m.id的值去資料庫中查詢，如果存在放入SingleLine或MultiLine，不存在則放入MissVal。然後快取起來，這裡呼叫的是非同步IO查詢。當有重複的key到來時就直接從快取中獲取資料往下傳送。

Flink的sink實戰之四：自定義
2020-11-11
elementUI 2.0.11自定義表頭
2018-11-20
UI
elementUI table 自定義表頭
2018-09-25
UI
Laravel 自定義表單驗證-自定義驗證規則
2019-10-18
Laravel
《從0到1學習Flink》—— 如何自定義 Data Source ？
2018-11-07
Flink 從 0 到 1 學習 —— 如何自定義 Data Sink ？
2019-09-21
Flink的DataSource三部曲之三:自定義
2020-11-07
Layui 自定義表單驗證
2020-12-07
UI
flink維表關聯絡列之Redis維表關聯：實時查詢
2019-12-29
Redis
6月23日直播預告丨如何自定義Flink LookupTable
2021-06-23
SharePoint Online 自定義Modern UI表單
2018-11-26
UI
小程式自定義表單校驗
2020-01-03
AngularJS自定義表單控制元件
2020-04-04
AngularJS控制元件
java 自定義表單設計方案
2021-10-20
Java
Flink去重統計-基於自定義布隆過濾器
2021-05-20
過濾器
Laravel-admin 自定義匯出表單
2018-09-26
Laravel
表單驗證自定義格式輸出
2019-09-24
使用 voyager 如何自定義,使用者表
2019-06-05
易優cms模板在哪自定義表單
2024-08-03
封裝 Laravel 自定義表單請求
2022-07-15
封裝Laravel
皕傑報表之自定義函式
2022-12-12
函式
DcatAdmin 擴充套件: 自定義表單(動態表單)
2022-06-27
套件
支付寶二維碼生成，自定義金額，自定義備註資訊，不限制生成數量
2023-03-10
Base64自定義編碼表及破解
2018-12-13
簡單的自定義表單控制元件
2024-05-13
控制元件
自定義表單系統開源是否好用？
2024-04-22
sqlite中存放自定義表結構的位置
2019-02-16
SQLite
C#自定義控制元件—儀表盤
2024-09-04
C#控制元件
如何快速開發靈活自定義報表
2022-09-19
Flink SQL FileSystem Connector 分割槽提交與自定義小檔案合併策略
2020-10-31
SQL
表單識別：自定義表單模板快速完成表單電子化
2019-11-25
c#WinFrom自定義圖表儀表控制元件-頻譜
2024-06-06
C#控制元件
SVG 菜鳥的 Recharts 自定義圖表實戰
2020-04-01
SVGEcharts
ElementUI 中 table 表格自定義表頭 Tooltip 文字提示
2020-04-29
UI
10.Flink實時專案之訂單維度表關聯
2022-03-31
android自定義view(自定義數字鍵盤)
2021-09-09
AndroidView
netty自定義Decoder用於自定義協議
2021-09-09
Netty協議
BI中事實表和維度表的定義(轉載)
2020-11-19

Flink 自定義維表

相關文章