深入理解Python中的生成器

Jesson發表於2015-08-16

生成器(generator)概念

生成器不會把結果儲存在一個系列中,而是儲存生成器的狀態,在每次進行迭代時返回一個值,直到遇到StopIteration異常結束。

生成器語法

生成器表示式: 通列表解析語法,只不過把列表解析的[]換成()
生成器表示式能做的事情列表解析基本都能處理,只不過在需要處理的序列比較大時,列表解析比較費記憶體。

生成器函式: 在函式中如果出現了yield關鍵字,那麼該函式就不再是普通函式,而是生成器函式。

但是生成器函式可以生產一個無線的序列,這樣列表根本沒有辦法進行處理。

yield 的作用就是把一個函式變成一個 generator,帶有 yield 的函式不再是一個普通函式,Python 直譯器會將其視為一個 generator。

下面為一個可以無窮生產奇數的生成器函式。

當然通過手動編寫迭代器可以實現類似的效果,只不過生成器更加直觀易懂

題外話: 生成器是包含有__iter()和next__()方法的,所以可以直接使用for來迭代,而沒有包含StopIteration的自編Iter來只能通過手動迴圈來迭代。

看到上面的結果,現在你可以很有信心的按照Iterator的方式進行迴圈了吧!

在 for 迴圈執行時,每次迴圈都會執行 fab 函式內部的程式碼,執行到 yield b 時,fab 函式就返回一個迭代值,下次迭代時,程式碼從 yield b 的下一條語句繼續執行,而函式的本地變數看起來和上次中斷執行前是完全一樣的,於是函式繼續執行,直到再次遇到 yield。看起來就好像一個函式在正常執行的過程中被 yield 中斷了數次,每次中斷都會通過 yield 返回當前的迭代值。

 

yield 與 return

在一個生成器中,如果沒有return,則預設執行到函式完畢時返回StopIteration;

 

如果遇到return,如果在執行過程中 return,則直接丟擲 StopIteration 終止迭代。

 

如果在return後返回一個值,那麼這個值為StopIteration異常的說明,不是程式的返回值。

生成器沒有辦法使用return來返回值。

 

生成器支援的方法

 

close()

手動關閉生成器函式,後面的呼叫會直接返回StopIteration異常。

 send()

生成器函式最大的特點是可以接受外部傳入的一個變數,並根據變數內容計算結果後返回。
這是生成器函式最難理解的地方,也是最重要的地方,實現後面我會講到的協程就全靠它了。

執行流程:

  1. 通過g.send(None)或者next(g)可以啟動生成器函式,並執行到第一個yield語句結束的位置。此時,執行完了yield語句,但是沒有給receive賦值。yield value會輸出初始值0注意:在啟動生成器函式時只能send(None),如果試圖輸入其它的值都會得到錯誤提示資訊。
  2. 通過g.send(‘aaa’),會傳入aaa,並賦值給receive,然後計算出value的值,並回到while頭部,執行yield value語句有停止。此時yield value會輸出”got: aaa”,然後掛起。
  3. 通過g.send(3),會重複第2步,最後輸出結果為”got: 3″
  4. 當我們g.send(‘e’)時,程式會執行break然後推出迴圈,最後整個函式執行完畢,所以會得到StopIteration異常。

最後的執行結果如下:

 throw()

用來向生成器函式送入一個異常,可以結束系統定義的異常,或者自定義的異常。
throw()後直接跑出異常並結束程式,或者消耗掉一個yield,或者在沒有下一個yield的時候直接進行到程式的結尾。

輸出結果為:

解釋:

  1. print(next(g)):會輸出normal value,並停留在yield ‘normal value 2’之前。
  2. 由於執行了g.throw(ValueError),所以會跳過所有後續的try語句,也就是說yield ‘normal value 2’不會被執行,然後進入到except語句,列印出we got ValueError here。然後再次進入到while語句部分,消耗一個yield,所以會輸出normal value。
  3. print(next(g)),會執行yield ‘normal value 2’語句,並停留在執行完該語句後的位置。
  4. g.throw(TypeError):會跳出try語句,從而print(‘here’)不會被執行,然後執行break語句,跳出while迴圈,然後到達程式結尾,所以跑出StopIteration異常。

下面給出一個綜合例子,用來把一個多維列表展開,或者說扁平化多維列表)

如果理解起來有點困難,那麼把print語句的註釋開啟在進行檢視就比較明瞭了。

 

總結

  1. 按照鴨子模型理論,生成器就是一種迭代器,可以使用for進行迭代。
  2. 第一次執行next(generator)時,會執行完yield語句後程式進行掛起,所有的引數和狀態會進行儲存。再一次執行next(generator)時,會從掛起的狀態開始往後執行。在遇到程式的結尾或者遇到StopIteration時,迴圈結束。
  3. 可以通過generator.send(arg)來傳入引數,這是協程模型。
  4. 可以通過generator.throw(exception)來傳入一個異常。throw語句會消耗掉一個yield。可以通過generator.close()來手動關閉生成器。
  5. next()等價於send(None)

相關文章