Python生成器

小小垂髫發表於2022-05-15

生成器

我們學習完推導式之後發現,推導式就是在容器中使用一個for迴圈而已,為什麼沒有元組推導式?

原因就是“元組推導式”的名字不是這樣的,而是叫做生成器表示式。

什麼是生成器

生成器表示式本質上就是一個迭代器,是定義迭代器的一種方式,是允許自定義邏輯的迭代器。生成器使用generator表示。

迭代器和生成器的區別

迭代器本身是系統內建的, 無法重寫內建的邏輯結構;而生成器是使用者自定義的,可以重寫邏輯結構。所以生成器就是一個迭代器,只是我們將自己寫的迭代器叫做生成器作為區分而已。

建立方式

生成器有兩種建立方式

  1. 生成器表示式,就是“元組推導式”
  2. 生成器函式,就是使用def定義,裡面使用yield關鍵字

生成器表示式

基本語法

from collections import Iterator, Iterable

# 生成器表示式(元組推導式)
gen = (i * 2 for i in range(1, 11))
print(isinstance(gen, Iterable))  # 判斷是否是迭代物件
print(isinstance(gen, Iterator))  # 判斷是否是迭代器

# 這個 gen 就是生成器

生成器函式

我們上面說到,生成器函式如何定義?其實和普通的函式定義的方法是一樣的,都是要使用def關鍵字來定義,其它的寫法沒有任何要求,普通函式怎麼寫生成器函式就怎麼寫,唯一的要求就是要使用yield關鍵字。

要注意,生成器函式就是一個函式,是使用了yield的函式,只不過生成器函式是用來定義生成器的。

yield關鍵字

yield這個關鍵字其實類似於return關鍵字,return關鍵字的作用是在函式中使用,用來返回資料,yield關鍵字的作用也是一樣的,就是用來返回資料,但是和return還有其它的不同之處。

yield和return

共同點

執行到對應語句的時候,就會返回對應的值。

不同點

return執行的時候,函式就跳出,然後return之後的所有作用域語句就會全部跳出,當函式再次呼叫的時候,整個函式就重新執行。

yield執行的時候,返回資料,但是函式就會記住跳出的位置,當你再次呼叫函式(生成器)的時候,就從上一次跳出的地方繼續執行,是不是和迭代器的取值有異曲同工之處?

yield的使用方法

yield的使用方法有兩種,一種是和return的使用方法一樣,在關鍵字的後面直接新增返回值,這是推薦使用的方法;

第二種方法使用將yield作為一個函式使用,就是在yield後面使用括號,在括號中填寫返回的值。

生成器函式的基本使用

# 1、定義一個生成器函式
# 生成器函式就是一個使用yield的函式
def myGen():
	print(1)
	yield 11
	print(2)
	yield 22
	print(3)
	yield 33


# 2、初始化生成器
# 執行生成器函式,返回一個物件,就是生成器物件,簡稱生成器
from collections import Iterator
gen = myGen()
res = isinstance(gen, Iterator)
print(res)  # True  返回True說明生成器本質上就是一個迭代器


# 3、呼叫生成器
# 生成器本質上就是一個迭代器,還記得迭代器如何呼叫嗎?
res = next(gen)
print(res)
"""
結果:
1   (生成器函式中的語句 print(1))
11  (yield返回的值,print(res))
"""

send的使用

sendnext一樣,都是用來取出迭代器中的值的函式,send是生成器的內建函式。而且send和next相比,功能更加的強大,next只能取值;send不但能取值,而且還能傳送值。

例項

定義生成器函式

def myGen():

   print('process start')
   #  res獲取yield的值
   res = yield 100

   print(res, '內部列印1')
   print('process start')
   res = yield 200

   print(res, '內部列印2')
   print('process start')
   res = yield 300

   print(res, '內部列印3')

初始化生成器

gen = myGen()

第一次呼叫生成器

# 在使用send時,第一次傳遞的資料必須是None,這是硬性語法,以為send第一次傳遞引數的時候,還沒有遇到yield,所以不能傳送。
res = gen.send(None)

print(res)
"""
結果:
process start
100
"""

使用send第一次呼叫生成器的時候執行了下面的語句:

print('process start')
res = yield 100

執行到yield 100的時候,才碰到了yield,但是send之前沒有遇到過yield,所以不能傳入任何值,None沒有任何意義,這是硬性語法。

這裡注意,res = yield 100中的res此時沒有任何價值。因為這個一條語句我們目前只執行了一半,執行了yield 100,還有res的賦值沒有完成,所以現在的res沒有任何的意義。

第一次呼叫生成器,返回100,這個100則是語句res = yield 100返回的值。

第二次呼叫

res = next(gen)
print(res)
"""
結果:
None 內部列印1
process start
200
"""

第二次呼叫執行了以下語句:

res = yield 100
print(res, '內部列印1')
print('process start')
res = yield 200

注意,生成器函式在呼叫的時候,會從上一次yield返回值的地方,就是res = yield 100,但是這個語句第二次呼叫的時候,只會執行一半,因為另一半在第一次呼叫的時候已經執行完了,就是yield 100,就是說還有res的賦值沒有進行,但是第二次呼叫使用的是next,next沒有傳送值的能力,所以res就沒有賦予任何值,,在列印的時候,res就是一個None。

第三次呼叫

res = gen.send('第三次呼叫')
print(res)
"""
結果:
第三次呼叫 內部列印2
process start
300
"""

第三次呼叫執行的語句是:

res = yield 200
print(res, '內部列印2')
print('process start')
res = yield 300

這次和第二次的呼叫基本是一樣的,但是這次是使用send呼叫,所以傳送了值過去,執行於是將值賦予了res。

第四次呼叫

res = gen.send(None)
print(res)

"""
結果:
None 內部列印3
StopIteration  (報錯)
"""

第四次呼叫,執行以下語句:

res = yield 300
print(res, '內部列印3')

第四次呼叫生成器,沒有可以執行的yield語句,所以返回不了任何資料,因此報出了 StopIteration的錯誤。

可迭代物件的優化

現在我們就已經學習完了容器和迭代器、生成器的相關知識,我們也知道了可迭代物件和迭代器的區別,那麼現在我們要說的是,如果我們需要制定一個容器供我們遍歷使用,那麼我們優先使用迭代器而不是容器這樣的一個普通的可迭代物件。

在我們之後的日常使用過程當中,我們有時就會發現,我們需要在一個迴圈中遍歷一個容器供我們使用,但是這個容器中的值非常多,使這個容器佔據的記憶體空間非常大,消耗了大量的資源,導致我們的程式非常慢。這個時候我們就需要使用迭代器或者生成器去遍歷,迭代器每次遍歷只佔據當次遍歷時的記憶體空間,因此非常的節省資源,所以這就是我們優先使用迭代器的理由。

總結

現在我們就學習完了python中的所有的函式型別,知道了python中的有內建函式、自定義函式,之後我們還會學習一些python的常用標準庫和第三方庫,裡面也有一些我們經常用到的函式。

  1. 普通函式,使用def定義
  2. 匿名函式,使用lambda定義
  3. 閉包函式,內函式呼叫外函式的變數,並且外函式將內函式返回,這樣的巢狀下,外函式就是一個閉包函式,但是一般的情況下,我們並不特意的作出一個閉包函式,而是要使用閉包這麼一個功能
  4. 高階函式,就是將函式作為引數使用的函式,常用的內建高階函式有map、filter、reduce、sorted
  5. 遞迴函式,自己呼叫自己的函式

相關文章