想分組聚合各省的條數、總額,及其平均數或者佔比的話,Python方便還是slq方便?

dcpeng發表於2024-03-28

大家好,我是Python進階者。

一、前言

前幾天在Python最強王者交流群【斌】問了一個資料處理的問題。問題如下:

求教大佬:我有全國的明細5000條,其中一個欄位是省(直轄市), 如果我想分組聚合各省的條數、總額,及其平均數或者佔比的話,Python方便還是sql方便?

二、實現過程

這裡【吳超建】提出Excel透視表就可以解決了,【DIY】和【黑科技·鼓包】也給出了自己的看法。

圖片
後來粉絲自己使用資料透視表搞定了。

圖片

就是佔比還需要自己寫個公式,不過這裡【吳超建】指出其實並不需要,具體做法如下所示。

圖片

後來【瑜亮老師】也給出了一個Python方法,python中用透視表也是一行程式碼。主要是引數aggfunc可以接受列表,以便於對某列數進行多種統計,如求和、求平均值等,同時還可以接受字典,分別對多列進行一種或多種統計。

圖片

上面這個是妥妥的乾貨分享,確實非常不錯!

順利地解決了粉絲的問題。

如果你也有類似這種Python相關的小問題,歡迎隨時來交流群學習交流哦,有問必答!

三、總結

大家好,我是Python進階者。這篇文章主要盤點了一個Excel資料透視表需求使用Python處理的問題,文中針對該問題,給出了具體的解析和程式碼實現,幫助粉絲順利解決了問題。

最後感謝粉絲【斌】提出的問題,感謝【吳超建】、【瑜亮老師】、【DIY】和【黑科技·鼓包】給出的思路,感謝【冷喵】等人參與學習交流。

【提問補充】溫馨提示,大家在群裡提問的時候。可以注意下面幾點:如果涉及到大檔案資料,可以資料脫敏後,發點demo資料來(小檔案的意思),然後貼點程式碼(可以複製的那種),記得發報錯截圖(截全)。程式碼不多的話,直接發程式碼文字即可,程式碼超過50行這樣的話,發個.py檔案就行。

相關文章