本文示例程式碼已上傳至我的
Github
倉庫https://github.com/CNFeffery/DataScienceStudyNotes
1 簡介
在日常執行程式的過程中常常涉及到迴圈迭代過程,對於執行時間很短的程式來說倒無所謂,但對於執行過程有明顯耗時的涉及迴圈迭代的程式,為其加上進度條(progress bar),是幫助我們監測程式碼執行進度以及處理中間異常錯誤非常實用的技巧。
本文就將為大家介紹Python
中非常實用又風格迥異的兩個進度條相關庫——tqdm
與alive-progress
的主要用法。
2 tqdm常用方法
tqdm
是Python
中所有進度條相關庫中最出名的,既然是最出名的,自然有它獨到之處。
tqdm
不僅可以生成基礎的可在終端中顯示的進度條,還可以配合jupyter notebook
和jupyter lab
生成更加美觀的網頁互動部件形式的進度條,更是和pandas
強強聯手,為pandas
中的一些操作提供專有的進度條功能。
下面我們來對tqdm
的主要功能進行介紹。
2.1 基礎用法
因為是第三方庫,首先需要利用pip install tqdm
或 conda install -c conda-forge tqdm
對其進行安裝,安裝完成後先來看看它最基本的用法:
利用tqdm.tqdm
,將for
迴圈過程中進行迭代的物件簡單包裹,就實現了為迴圈過程新增進度條以及列印執行速度、已執行時間與預估剩餘執行時間等實用資訊的功能,同樣也可用於列表推導:
而針對迭代物件是range()
的情況,tqdm
還提供了簡化版的trange()
來代替tqdm(range())
:
其附帶的引數desc
還可以幫助我們設定進度條的說明文字:
而如果想要在迭代過程中變更說明文字,還可以預先例項化進度條物件,在需要重新整理說明文字的時候執行相應的程式:
但當迭代的物件長度一開始未知時,譬如對pandas
中的DataFrame.itertuples()
進行迭代,我們就只能對其執行速度等資訊進行估計,但無法看到進度條遞增情況,因為tqdm
不清楚迭代的終點如何:
2.2 配合jupyter notebook/jupyter lab的美觀進度條
tqdm
對jupyter notebook
和jupyter lab
有著特殊的支援,且使用方法非常簡單,只需要將原有的from tqdm import XXX
的相應功能匯入格式修改為from tqdm.notebook import XXX
就可以了,以trange
為例:
2.3 配合pandas中的apply
tqdm
對pandas
中的apply()
過程提供了特殊的支援,因為pandas
中的apply()
本質上就是序列迴圈運算,你可以將pandas
中的任何apply
操作替換為progress_apply
,並且記住每個單獨的progress_apply
前要先執行tqdm.pandas()
,就像下面的例子一樣:
3 alive-progress常用方法
雖然與tqdm
一樣都是為了給迴圈過程加上進度條而誕生的庫,但alive-progress
相比tqdm
增加了更多花樣繁多的動態效果,我們通過呼叫其專門提供的showtime()
函式可以檢視所有可用的動態進度條樣式:
同樣類似地可以檢視所有進度條樣式:
使用起來也是非常簡單,但與tqdm
用法區別很大,需要配合with
關鍵詞,譬如下面我們使用到alive_progress
中的alive_bar
來生成動態進度條:
通過修改bar
引數來改變進度條的樣式:
更多關於alive-progress
的內容感興趣的朋友可以檢視官方說明:(https://github.com/rsalmei/alive-progress),但比較遺憾的是目前的alive-progress
只能在終端中執行,還沒有為jupyter
開發更美觀的互動式部件,但你可以在譬如網路爬蟲等任務中使用它,效果也是很不錯的。
以上就是本文的全部內容,如有疑問歡迎在評論區與我討論~