一句話實現MySQL庫中的按連續等值分組

xiaohuihui發表於2020-06-23

這種分組的依據是比較上一行欄位值,發生變化時產生新組。SQL 僅支援等值分組,要想實現這種有序分組就得經過幾次資料變換,變換成等值分組。以支援視窗函式的新版 MySQL 為例,大概經過這麼三步:

1、得出變化標誌欄位 flag。透過視窗函式 lag 得到上一行的欄位值,發生變化 flag=1,否則為 0;

2、累加 flag 欄位得到 acc 欄位。從第一行累加到當前行,還是得用視窗函式實現:sum(flag)…BETWEEN ROWS UNBOUNDED AND CURRENT ROW;

3、按 acc 欄位進行常規等值分組即可。

早期沒有視窗函式的 MySQL,理論上也能實現,更復雜,就不細說了。

 

這類有序分組如果用 SPL 語言就很簡單,用 group 操作的 @o 選項,一句話就搞定了:

=connect(”mysqlDB”).query(“select * from t”).group@o(f)

完成分組動作後,得到兩層結構的序表 B。後續針對第二層分組子集,做任意計算也都容易一句搞定:

=B.max(~.len()) 得到最大組的行數;

=B.(~.new(f,avg(f2))).conj() 得到每組 f2 的平均值;

=B.(~.sort@z(f2).m(to(3))).conj() 取出每組 f2 最大的三行;

 

除了連續等值分組,還有更通用的有序條件分組,比如與上一行的差值大於 10 時,產生新組:

=connect(”mysqlDB”).query(“select * from t”).group@i(f>~[-1].f+10)

還有按照序號分組,巢狀分組等多種 SQL 難實現的分組方式,詳情參考 。

 

當資料不在資料庫裡時,SPL 執行復雜計算仍然方便:
=file(“d:/t.csv”).import(;,",").group...

SPL能很方便地嵌入到JAVA應用,可參考 。

具體使用方法可參考 。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69900830/viewspace-2700112/,如需轉載,請註明出處,否則將追究法律責任。

相關文章