草根學Python(七) 迭代器和生成器

兩點水發表於2019-03-04

前言

這篇部落格寫了很久,其實寫每一篇部落格用的時間還是挺長的,不夠這有利於自己的學習,也想分享一下。之前也說了建立了一個微信群,Python 學習討論群,現在只有 40 個左右的小夥伴,如果有興趣加入學習討論的話,可以加我微信:androidwed,拉你進群。想看回之前的文章,也可以通過 Gitbook 檢視,歡迎提出問題和點下 star,及時檢視更新。

目錄

草根學Python(七)  迭代器和生成器
草根學Python(七) 迭代器和生成器

一、迭代

什麼叫做迭代?

比如在 Java 中,我們通過 List 集合的下標來遍歷 List 集合中的元素,在 Python 中,給定一個 list 或 tuple,我們可以通過 for 迴圈來遍歷這個 list 或 tuple ,這種遍歷就是迭代。

可是,Python 的 for 迴圈抽象程度要高於 Java 的 for 迴圈的,為什麼這麼說呢?因為 Python 的 for 迴圈不僅可以用在 list 或tuple 上,還可以作用在其他可迭代物件上。也就是說,只要是可迭代的物件,無論有沒有下標,都是可以迭代的。

比如:


# -*- coding: UTF-8 -*-

# 1、for 迴圈迭代字串
for char in 'liangdianshui' :
    print ( char , end = ' ' )

print('\n')

# 2、for 迴圈迭代 list
list1 = [1,2,3,4,5]
for num1 in list1 :
    print ( num1 , end = ' ' )

print('\n')

# 3、for 迴圈也可以迭代 dict (字典)
dict1 = {'name':'兩點水','age':'23','sex':'男'}

for key in dict1 :    # 迭代 dict 中的 key
    print ( key , end = ' ' )

print('\n')

for value in dict1.values() :   # 迭代 dict 中的 value
    print ( value , end = ' ' )

print ('\n')

# 如果 list 裡面一個元素有兩個變數,也是很容易迭代的
for x , y in [ (1,'a') , (2,'b') , (3,'c') ] :
    print ( x , y )複製程式碼

輸出的結果如下:

l i a n g d i a n s h u i 

1 2 3 4 5 

name age sex 

兩點水 23 男 

1 a
2 b
3 c複製程式碼

二、Python 迭代器

上面簡單的介紹了一下迭代,迭代是 Python 最強大的功能之一,是訪問集合元素的一種方式。現在正式進入主題:迭代器,迭代器是一個可以記住遍歷的位置的物件。

迭代器物件從集合的第一個元素開始訪問,直到所有的元素被訪問完結束。

迭代器只能往前不會後退。

迭代器有兩個基本的方法:iter() 和 next(),且字串,列表或元組物件都可用於建立迭代器,迭代器物件可以使用常規 for 語句進行遍歷,也可以使用 next() 函式來遍歷。

具體的例項:

# 1、字元創建立迭代器物件
str1 = 'liangdianshui'
iter1 = iter ( str1 )

# 2、list物件建立迭代器
list1 = [1,2,3,4]
iter2 = iter ( list1 )

# 3、tuple(元祖) 物件建立迭代器
tuple1 = ( 1,2,3,4 )
iter3 = iter ( tuple1 )

# for 迴圈遍歷迭代器物件
for x in iter1 :
    print ( x , end = ' ' )

print('\n------------------------')

# next() 函式遍歷迭代器
while True :
    try :
        print ( next ( iter3 ) )
    except StopIteration :
        break複製程式碼

最後輸出的結果:

l i a n g d i a n s h u i 
------------------------
1
2
3
4複製程式碼

三、lsit 生成式(列表生成式)

1、建立 list 的方式

之前經過我們的學習,都知道如何建立一個 list ,可是有些情況,用賦值的形式建立一個 list 太麻煩了,特別是有規律的 list ,一個一個的寫,一個一個賦值,太麻煩了。比如要生成一個有 30 個元素的 list ,裡面的元素為 1 - 30 。我們可以這樣寫:

# -*- coding: UTF-8 -*-

list1=list ( range (1,31) )
print(list1)複製程式碼

輸出的結果:

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30]複製程式碼

這個其實在之前也有提到過:比如有個例子,列印九九乘法表,用這個方法其實就幾句程式碼就可以了,具體可以看之前的這個章節:條件語句和迴圈語句綜合例項

但是,如果用到 list 生成式,可以一句程式碼就生成九九乘法表了。具體看程式碼:

print('\n'.join([' '.join ('%dx%d=%2d' % (x,y,x*y)  for x in range(1,y+1)) for y in range(1,10)]))複製程式碼

最後輸出的結果:

1x1= 1
1x2= 2 2x2= 4
1x3= 3 2x3= 6 3x3= 9
1x4= 4 2x4= 8 3x4=12 4x4=16
1x5= 5 2x5=10 3x5=15 4x5=20 5x5=25
1x6= 6 2x6=12 3x6=18 4x6=24 5x6=30 6x6=36
1x7= 7 2x7=14 3x7=21 4x7=28 5x7=35 6x7=42 7x7=49
1x8= 8 2x8=16 3x8=24 4x8=32 5x8=40 6x8=48 7x8=56 8x8=64
1x9= 9 2x9=18 3x9=27 4x9=36 5x9=45 6x9=54 7x9=63 8x9=72 9x9=81複製程式碼

不過,這裡我們先要了解如何建立 list 生成式

2、list 生成式的建立

首先,lsit 生成式的語法為:

[expr for iter_var in iterable] 
[expr for iter_var in iterable if cond_expr]複製程式碼

第一種語法:首先迭代 iterable 裡所有內容,每一次迭代,都把 iterable 裡相應內容放到iter_var 中,再在表示式中應用該 iter_var 的內容,最後用表示式的計算值生成一個列表。

第二種語法:加入了判斷語句,只有滿足條件的內容才把 iterable 裡相應內容放到 iter_var 中,再在表示式中應用該 iter_var 的內容,最後用表示式的計算值生成一個列表。

其實不難理解的,因為是 list 生成式,因此肯定是用 [] 括起來的,然後裡面的語句是把要生成的元素放在前面,後面加 for 迴圈語句或者 for 迴圈語句和判斷語句。

例子:

# -*- coding: UTF-8 -*-
lsit1=[x * x for x in range(1, 11)]
print(lsit1)複製程式碼

輸出的結果:

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]複製程式碼

可以看到,就是把要生成的元素 x * x 放到前面,後面跟 for 迴圈,就可以把 list 建立出來。那麼 for 迴圈後面有 if 的形式呢?又該如何理解:

# -*- coding: UTF-8 -*-
lsit1= [x * x for x in range(1, 11) if x % 2 == 0]
print(lsit1)複製程式碼

輸出的結果:

[4, 16, 36, 64, 100]複製程式碼

這個例子是為了求 1 到 10 中偶數的平方根,上面也說到, x * x 是要生成的元素,後面那部分其實就是在 for 迴圈中巢狀了一個 if 判斷語句。

那麼有了這個知識點,我們也可以猜想出,for 迴圈裡面也巢狀 for 迴圈。具體示例:

# -*- coding: UTF-8 -*-
lsit1= [(x+1,y+1) for x in range(3) for y in range(5)] 
print(lsit1)複製程式碼

輸出的結果:

[(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (2, 1), (2, 2), (2, 3), (2, 4), (2, 5), (3, 1), (3, 2), (3, 3), (3, 4), (3, 5)]複製程式碼

其實知道了 list 生成式是怎樣組合的,就不難理解這個東西了。因為 list 生成式只是把之前學習的知識點進行了組合,換成了一種更簡潔的寫法而已。

四、生成器

1、為什麼需要生成器

通過上面的學習,可以知道列表生成式,我們可以直接建立一個列表。但是,受到記憶體限制,列表容量肯定是有限的。而且,建立一個包含 1000 萬個元素的列表,不僅佔用很大的儲存空間,如果我們僅僅需要訪問前面幾個元素,那後面絕大多數元素佔用的空間都白白浪費了。

所以,如果列表元素可以按照某種演算法推算出來,那我們是否可以在迴圈的過程中不斷推算出後續的元素呢?這樣就不必建立完整的 list,從而節省大量的空間。在 Python 中,這種一邊迴圈一邊計算的機制,稱為生成器:generator。

在 Python 中,使用了 yield 的函式被稱為生成器(generator)。

跟普通函式不同的是,生成器是一個返回迭代器的函式,只能用於迭代操作,更簡單點理解生成器就是一個迭代器。

在呼叫生成器執行的過程中,每次遇到 yield 時函式會暫停並儲存當前所有的執行資訊,返回yield的值。並在下一次執行 next()方法時從當前位置繼續執行。

那麼如何建立一個生成器呢?

2、生成器的建立

最簡單最簡單的方法就是把一個列表生成式的 [] 改成 ()

# -*- coding: UTF-8 -*-
gen= (x * x for x in range(10))
print(gen)複製程式碼

輸出的結果:

generator object  at 0x0000000002734A40複製程式碼

建立 List 和 generator 的區別僅在於最外層的 []() 。但是生成器並不真正建立數字列表, 而是返回一個生成器,這個生成器在每次計算出一個條目後,把這個條目“產生” ( yield ) 出來。 生成器表示式使用了“惰性計算” ( lazy evaluation,也有翻譯為“延遲求值”,我以為這種按需呼叫 call by need 的方式翻譯為惰性更好一些),只有在檢索時才被賦值( evaluated ),所以在列表比較長的情況下使用記憶體上更有效。

那麼竟然知道了如何建立一個生成器,那麼怎麼檢視裡面的元素呢?

3、遍歷生成器的元素

按我們的思維,遍歷用 for 迴圈,對了,我們可以試試:

# -*- coding: UTF-8 -*-
gen= (x * x for x in range(10))

for num  in  gen :
    print(num)複製程式碼

沒錯,直接這樣就可以遍歷出來了。當然,上面也提到了迭代器,那麼用 next() 可以遍歷嗎?當然也是可以的。

4、以函式的形式實現生成器

上面也提到,建立生成器最簡單最簡單的方法就是把一個列表生成式的 [] 改成 ()。為啥突然來個以函式的形式來建立呢?

其實生成器也是一種迭代器,但是你只能對其迭代一次。這是因為它們並沒有把所有的值存在記憶體中,而是在執行時生成值。你通過遍歷來使用它們,要麼用一個“for”迴圈,要麼將它們傳遞給任意可以進行迭代的函式和結構。而且實際運用中,大多數的生成器都是通過函式來實現的。那麼我們該如何通過函式來建立呢?

先不急,來看下這個例子:

# -*- coding: UTF-8 -*-
def my_function():
    for i in range(10):
        print ( i )

my_function()複製程式碼

輸出的結果:

0
1
2
3
4
5
6
7
8
9複製程式碼

如果我們需要把它變成生成器,我們只需要把 print ( i ) 改為 yield i 就可以了,具體看下修改後的例子:

# -*- coding: UTF-8 -*-
def my_function():
    for i in range(10):
        yield i

print(my_function())複製程式碼

輸出的結果:

generator object my_function at 0x0000000002534A40複製程式碼

但是,這個例子非常不適合使用生成器,發揮不出生成器的特點,生成器的最好的應用應該是:你不想同一時間將所有計算出來的大量結果集分配到記憶體當中,特別是結果集裡還包含迴圈。因為這樣會耗很大的資源。

比如下面是一個計算斐波那契數列的生成器:

# -*- coding: UTF-8 -*-
def fibon(n):
    a = b = 1
    for i in range(n):
        yield a
        a, b = b, a + b

# 引用函式
for x in fibon(1000000):
    print(x , end = ' ')複製程式碼

執行的效果:

計算斐波那契數列的生成器
計算斐波那契數列的生成器

你看,執行一個這麼打的引數,也不會說有卡死的狀態,因為這種方式不會使用太大的資源。這裡,最難理解的就是 generator 和函式的執行流程不一樣。函式是順序執行,遇到 return 語句或者最後一行函式語句就返回。而變成 generator 的函式,在每次呼叫 next() 的時候執行,遇到 yield語句返回,再次執行時從上次返回的 yield 語句處繼續執行。

比如這個例子:

# -*- coding: UTF-8 -*-
def odd():
    print ( 'step 1' )
    yield ( 1 )
    print ( 'step 2' )
    yield ( 3 )
    print ( 'step 3' )
    yield ( 5 )

o = odd()
print( next( o ) ) 
print( next( o ) ) 
print( next( o ) )複製程式碼

輸出的結果:

step 1
1
step 2
3
step 3
5複製程式碼

可以看到,odd 不是普通函式,而是 generator,在執行過程中,遇到 yield 就中斷,下次又繼續執行。執行 3 次 yield 後,已經沒有 yield 可以執行了,如果你繼續列印 print( next( o ) ) ,就會報錯的。所以通常在 generator 函式中都要對錯誤進行捕獲。

5、列印楊輝三角

通過學習了生成器,我們可以直接利用生成器的知識點來列印楊輝三角:

# -*- coding: UTF-8 -*-
def triangles( n ):         # 楊輝三角形
    L = [1]
    while True:
        yield L
        L.append(0)
        L = [ L [ i -1 ] + L [ i ] for i in range (len(L))]

n= 0
for t in triangles( 10 ):   # 直接修改函式名即可執行
    print(t)
    n = n + 1
    if n == 10:
        break複製程式碼

輸出的結果為:

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]複製程式碼

五、迭代器和生成器綜合例子

因為迭代器和生成器基本是互通的,因此有些知識點需要綜合在一起

1、反向迭代

反向迭代,應該也是常有的需求了,比如從一開始迭代的例子裡,有個輸出 list 的元素,從 1 到 5 的

list1 = [1,2,3,4,5]
for num1 in list1 :
    print ( num1 , end = ' ' )複製程式碼

那麼我們從 5 到 1 呢?這也很簡單, Python 中有內建的函式 reversed()

list1 = [1,2,3,4,5]
for num1 in reversed(list1) :
    print ( num1 , end = ' ' )複製程式碼

方向迭代很簡單,可是要注意一點就是:反向迭代僅僅當物件的大小可預先確定或者物件實現了 __reversed__() 的特殊方法時才能生效。 如果兩者都不符合,那你必須先將物件轉換為一個列表才行

其實很多時候我們可以通過在自定義類上實現 __reversed__() 方法來實現反向迭代。不過有些知識點在之前的篇節中還沒有提到,不過可以相應的看下,有程式設計基礎的,學完上面的知識點應該也能理解的。

# -*- coding: UTF-8 -*-

class Countdown:
    def __init__(self, start):
        self.start = start

    def __iter__(self):
        # Forward iterator
        n = self.start
        while n > 0:
            yield n
            n -= 1

    def __reversed__(self):
        # Reverse iterator
        n = 1
        while n <= self.start:
            yield n
            n += 1

for rr in reversed(Countdown(30)):
    print(rr)
for rr in Countdown(30):
    print(rr)複製程式碼

輸出的結果是 1 到 30 然後 30 到 1 ,分別是順序列印和倒序列印

2、同時迭代多個序列

你想同時迭代多個序列,每次分別從一個序列中取一個元素。你遇到過這樣的需求嗎?

為了同時迭代多個序列,使用 zip() 函式,具體示例:

# -*- coding: UTF-8 -*-

names = ['laingdianshui', 'twowater', '兩點水']
ages = [18, 19, 20]
for name, age in zip(names, ages):
     print(name,age)複製程式碼

輸出的結果:

laingdianshui 18
twowater 19
兩點水 20複製程式碼

其實 zip(a, b) 會生成一個可返回元組 (x, y) 的迭代器,其中 x 來自 a,y 來自 b。 一旦其中某個序列到底結尾,迭代宣告結束。 因此迭代長度跟引數中最短序列長度一致。注意理解這句話喔,也就是說如果 a , b 的長度不一致的話,以最短的為標準,遍歷完後就結束。

利用 zip() 函式,我們還可把一個 key 列表和一個 value 列表生成一個 dict (字典),如下:

# -*- coding: UTF-8 -*-

names = ['laingdianshui', 'twowater', '兩點水']
ages = [18, 19, 20]

dict1= dict(zip(names,ages))

print(dict1)複製程式碼

輸出如下結果:

{'laingdianshui': 18, 'twowater': 19, '兩點水': 20}複製程式碼

這裡提一下, zip() 是可以接受多於兩個的序列的引數,不僅僅是兩個。

相關文章