ClickHouse 實時資料去重final+group by

極客阿寶發表於2020-11-25

實時資料使用final 最為保險。
實時資料求和用final + group by 最為保險

一、實時資料獲取最新訂單狀態並去重

1. 使用final (推薦)

去重並取最新的資料

select
order_number		--訂單號
,id	--產品ID
,cnt--產品數量
,price--產品當時價格
from a final
where no='1234567'

在這裡插入圖片描述

2. 使用group by

--數量共4   產品65 2個 產品66 2個
select
order_number		--訂單號
,id	--產品ID
,cnt--產品數量
,price--產品當時價格
from a
where no='1234567'
group by
order_number		--訂單號
,id	--產品ID
,cnt--產品數量
,price --產品當時價格 

在這裡插入圖片描述

3. 使用argMax() (不可取)

去重了相同數量不同產品id 的資料,不準確

--此處只顯示一個 2
select
 order_number	--訂單號
,argMax(id,loaddate) id	--產品ID
,argMax(cnt,loaddate)	cnt--產品數量
,argMax(price,loaddate)	price--產品當時價格
from a
where no='1234567'
group by order_number		--訂單號

在這裡插入圖片描述

二、實時資料金額求和獲取最新訂單狀態並去重使用final +group by

此處訂單重複,需要去重後再彙總

select
order_number  --訂單號
,amt  --訂單金額
from b  
where order_number  ='123'  

在這裡插入圖片描述

1. 使用final+group by (推薦)

select
 order_number  
 ,sum(amt)
from  b  final
where order_number  ='123'
group by order_number  ;

在這裡插入圖片描述

2. 只使用group by (不可取)

select
 order_number  
 ,sum(amt)
from  b
where order_number  ='123'
group by order_number  ;

在這裡插入圖片描述

相關文章