在迴圈物件和函式物件中,我們瞭解了迴圈器(iterator)的功能。迴圈器是物件的容器,包含有多個物件。通過呼叫迴圈器的next()方法 (__next__()方法,在Python 3.x中),迴圈器將依次返回一個物件。直到所有的物件遍歷窮盡,迴圈器將舉出StopIteration錯誤。
在for i in iterator結構中,迴圈器每次返回的物件將賦予給i,直到迴圈結束。使用iter()內建函式,我們可以將諸如表、字典等容器變為迴圈器。比如
1 2 |
for i in iter([2, 4, 5, 6]): print(i) |
標準庫中的itertools包提供了更加靈活的生成迴圈器的工具。這些工具的輸入大都是已有的迴圈器。另一方面,這些工具完全可以自行使用Python實現,該包只是提供了一種比較標準、高效的實現方式。這也符合Python“只有且最好只有解決方案”的理念。
1 2 |
# import the tools from itertools import * |
無窮迴圈器
count(5, 2) #從5開始的整數迴圈器,每次增加2,即5, 7, 9, 11, 13, 15 …
cycle(‘abc’) #重複序列的元素,既a, b, c, a, b, c …
repeat(1.2) #重複1.2,構成無窮迴圈器,即1.2, 1.2, 1.2, …
repeat也可以有一個次數限制:
repeat(10, 5) #重複10,共重複5次
函式式工具
函數語言程式設計是將函式本身作為處理物件的程式設計正規化。在Python中,函式也是物件,因此可以輕鬆的進行一些函式式的處理,比如map(), filter(), reduce()函式。
itertools包含類似的工具。這些函式接收函式作為引數,並將結果返回為一個迴圈器。
比如
1 2 3 4 5 6 |
from itertools import * rlt = imap(pow, [1, 2, 3], [1, 2, 3]) for num in rlt: print(num) |
上面顯示了imap函式。該函式與map()函式功能相似,只不過返回的不是序列,而是一個迴圈器。包含元素1, 4, 27,即1**1, 2**2, 3**3的結果。函式pow(內建的乘方函式)作為第一個引數。pow()依次作用於後面兩個列表的每個元素,並收集函式結果,組成返回的迴圈器。
此外,還可以用下面的函式:
starmap(pow, [(1, 1), (2, 2), (3, 3)])
pow將依次作用於表的每個tuple。
ifilter函式與filter()函式類似,只是返回的是一個迴圈器。
1 |
ifilter(lambda x: x > 5, [2, 3, 5, 6, 7] |
將lambda函式依次作用於每個元素,如果函式返回True,則收集原來的元素。6, 7
此外,
ifilterfalse(lambda x: x > 5, [2, 3, 5, 6, 7])
與上面類似,但收集返回False的元素。2, 3, 5
takewhile(lambda x: x < 5, [1, 3, 6, 7, 1])
當函式返回True時,收集元素到迴圈器。一旦函式返回False,則停止。1, 3
dropwhile(lambda x: x < 5, [1, 3, 6, 7, 1])
當函式返回False時,跳過元素。一旦函式返回True,則開始收集剩下的所有元素到迴圈器。6, 7, 1
組合工具
我們可以通過組合原有迴圈器,來獲得新的迴圈器。
chain([1, 2, 3], [4, 5, 7]) # 連線兩個迴圈器成為一個。1, 2, 3, 4, 5, 7
product(‘abc’, [1, 2]) # 多個迴圈器集合的笛卡爾積。相當於巢狀迴圈
1 2 |
for m, n in product('abc', [1, 2]): print m, n |
permutations(‘abc’, 2) # 從’abcd’中挑選兩個元素,比如ab, bc, … 將所有結果排序,返回為新的迴圈器。
注意,上面的組合分順序,即ab, ba都返回。
combinations(‘abc’, 2) # 從’abcd’中挑選兩個元素,比如ab, bc, … 將所有結果排序,返回為新的迴圈器。
注意,上面的組合不分順序,即ab, ba的話,只返回一個ab。
combinations_with_replacement(‘abc’, 2) # 與上面類似,但允許兩次選出的元素重複。即多了aa, bb, cc
groupby()
將key函式作用於原迴圈器的各個元素。根據key函式結果,將擁有相同函式結果的元素分到一個新的迴圈器。每個新的迴圈器以函式返回結果為標籤。
這就好像一群人的身高作為迴圈器。我們可以使用這樣一個key函式: 如果身高大於180,返回”tall”;如果身高底於160,返回”short”;中間的返回”middle”。最終,所有身高將分為三個迴圈器,即”tall”, “short”, “middle”。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
def height_class(h): if h > 180: return "tall" elif h < 160: return "short" else: return "middle" friends = [191, 158, 159, 165, 170, 177, 181, 182, 190] friends = sorted(friends, key = height_class) for m, n in groupby(friends, key = height_class): print(m) print(list(n)) |
注意,groupby的功能類似於UNIX中的uniq命令。分組之前需要使用sorted()對原迴圈器的元素,根據key函式進行排序,讓同組元素先在位置上靠攏。
其它工具
compress(‘ABCD’, [1, 1, 1, 0]) # 根據[1, 1, 1, 0]的真假值情況,選擇第一個引數’ABCD’中的元素。A, B, C
islice() # 類似於slice()函式,只是返回的是一個迴圈器
izip() # 類似於zip()函式,只是返回的是一個迴圈器。
總結
itertools的工具都可以自行實現。itertools只是提供了更加成形的解決方案。