背景
週末在寫一個爬蟲時,遇到這樣一種場景:從搜尋結果中下載指定數量的檔案
例如:搜尋結果中共分為10頁展示,加起來一共50條資料,現在要做的是從50條資料中下載指定數量的資料
為了實現這個功能,開始我是這樣想的:
1、依次遍歷10頁資料,並且把每頁的資料都追加到同一個列表中,這樣的話,請求完10頁資料後,這個列表中就包含了所有結果;
2、然後再從這個大列表中提取指定數量的資料進行下載即可
這種方法確實可行,但是在執行過程中發現一個問題:程式執行速度太慢了,原因是無論你想下載多少條資料,都會先把所有資料請求下來並追加到列表中,這個過程實在是太耗時了,而且也不合理
所以換一種思路:要下載n條資料,就只提取n條,不提前把所有資料請求下來
具體實現方法
上面舉的例子,可以抽象為如下功能
首先有一個巢狀的列表
[[1,2,3,4,5],[6,7,8,9,10],[11,12,13,14,15],[16,17,18,19,20]]
然後提取這個列表中的資料到一個新的列表中,例如取前3個數字、前5個數字或者前8個數字
可以通過雙層for迴圈來實現,另外要注意設定條件來跳出迴圈,如下
1 source = [[1,2,3,4,5],[6,7,8,9,10],[11,12,13,14,15],[16,17,18,19,20]] 2 target = [] 3 4 def get_data(source, count): 5 for i in range(0, len(source)+1): 6 temp = source[i] 7 for j in temp: 8 target.append(j) 9 if len(target) >= count: 10 break 11 12 else: 13 continue 14 break 15 16 t = get_data(source, 6) 17 print(target)
source代表原列表;count代表提取數字的個數
根據菜鳥教程的提示, for ... else 的意思如下:
1、for 中的語句和普通的沒有區別,else 中的語句會在迴圈正常執行完的情況下執行(即 for 不是通過 break 跳出而中斷的);
2、如果for是由於break中斷的,則不會執行else語句
來分析下count為不同值時的執行過程及結果
1、count=3
當count=3時,得到如下結果
target = [1, 2, 3]
source中包含4個子列表,每個子列表包含5個數字;
先遍歷外層for迴圈,當遍歷到第一個子列表時,就能夠滿足內層for迴圈中斷的條件了,即:當提取到第一個子列表的數字3時,target的長度等於3,滿足len(target)>=count,跳出內層for迴圈
由於此時不是正常退出內層for迴圈,所以不會執行後面的else語句(ps:這裡else語句下是執行continue指令,也就是繼續遍歷外層for迴圈),然後繼續執行else後的berak語句,跳出外層for迴圈
綜上,得到 target = [1, 2, 3] 的結果
2、count=8
當count=3時,得到如下結果
target = [1, 2, 3, 4, 5, 6, 7, 8]
同樣,先取出外層for迴圈的第一個子列表,第一個子列表只有5個數字,當遍歷完後,target的長度等於5,不滿足len(target)>=count
此時內層for迴圈正常結束第一輪遍歷,由於for迴圈正常結束,所以執行else下的語句,也就是執行continue指令,這裡的continue是針對外層for迴圈的,也就是說繼續取出外層for迴圈的第二個子列表
當第二個子列表遍歷到第三個數字時,target的長度等於8,滿足len(target)>=count,,跳出內層for迴圈
同理,由於此時不是正常退出內層for迴圈,所以不會執行後面的else語句,然後繼續執行else後的berak語句,跳出外層for迴圈
綜上,得到 target =[1, 2, 3, 4, 5, 6, 7, 8] 的結果
以上就是 for ... else 跳出雙層巢狀迴圈的內容,希望對大家有幫助~