一句話實現MySQL庫中的按條件變化分組

xiaohuihui發表於2020-06-23

這種分組的依據是比較上一行欄位值,發生某種變化時(如變大超過 10)產生新組。SQL 僅支援等值分組,要想實現這種有序條件分組就得經過幾次資料變換,變換成等值分組。以支援視窗函式的新版 MySQL 為例,大概經過這麼三步:

1、得出變化標誌欄位 flag。透過視窗函式 lag 得到上一行的欄位值,滿足變化條件(如本行 - 上一行 >10)flag 設為 1,否則為 0;

2、累加 flag 欄位得到 acc 欄位。從第一行累加到當前行,還是得用視窗函式實現:sum(flag)…BETWEEN ROWS UNBOUNDED AND CURRENT ROW;

3、按 acc 欄位進行常規等值分組即可。

早期沒有視窗函式的 MySQL,理論上也能實現,更復雜,就不細說了。

 

這類有序分組如果用 SPL 語言就很簡單,用 group 操作的 @i 選項,一句就搞定了:

=connect(”mysqlDB”).query(“select * from t”).group@i(f>~[-1].f+10)

完成分組動作後,得到兩層結構的序表 B。後續針對第二層分組子集,做任意計算也都容易一句搞定:

=B.max(~.len()) 得到最大組的行數;

=B.(~.new(f,avg(f2))).conj() 得到每組 f2 的平均值;

=B.(~.sort@z(f2).m(to(3))).conj() 取出每組 f2 最大的三行;

除了有序條件分組,還有有序等值分組,巢狀分組等多種 SQL 難實現的分組方式,詳情參考 。

 

當資料不在資料庫裡時,SPL 執行復雜計算仍然方便:
=file(“d:/t.csv”).import(;,",").group...

SPL能很方便地嵌入到JAVA應用,可參考 。

具體使用方法可參考 。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69900830/viewspace-2700070/,如需轉載,請註明出處,否則將追究法律責任。

相關文章