Python中的閉包不是一個一說就能明白的概念,但是隨著你往學習的深入,無論如何你都需要去了解這麼一個東西。
閉包的概念
我們嘗試從概念上去理解一下閉包。
在一些語言中,在函式中可以(巢狀)定義另一個函式時,如果內部的函式引用了外部的函式的變數,則可能產生閉包。閉包可以用來在一個函式與一組“私有”變數之間建立關聯關係。在給定函式被多次呼叫的過程中,這些私有變數能夠保持其永續性。
—— 維基百科)
用比較容易懂的人話說,就是當某個函式被當成物件返回時,夾帶了外部變數,就形成了一個閉包。看例子。
1 2 3 4 5 6 7 |
def make_printer(msg): def printer(): print msg # 夾帶私貨(外部變數) return printer # 返回的是函式,帶私貨的函式 printer = make_printer('Foo!') printer() |
支援將函式當成物件使用的程式語言,一般都支援閉包。比如Python, JavaScript。
如何理解閉包
閉包存在有什麼意義呢?為什麼需要閉包?
我個人認為,閉包存在的意義就是它夾帶了外部變數(私貨),如果它不夾帶私貨,它和普通的函式就沒有任何區別。同一個的函式夾帶了不同的私貨,就實現了不同的功能。其實你也可以這麼理解,閉包和麵向介面程式設計的概念很像,可以把閉包理解成輕量級的介面封裝。
介面定義了一套對方法簽名的約束規則。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
def tag(tag_name): def add_tag(content): return "<{0}>{1}</{0}>".format(tag_name, content) return add_tag content = 'Hello' add_tag = tag('a') print add_tag(content) # <a>Hello</a> add_tag = tag('b') print add_tag(content) # <b>Hello</b> |
在這個例子裡,我們想要一個給content
加tag
的功能,但是具體的tag_name
是什麼樣子的要根據實際需求來定,對外部呼叫的介面已經確定,就是add_tag(content)
。如果按照面向介面方式實現,我們會先把add_tag
寫成介面,指定其引數和返回型別,然後分別去實現a和b的add_tag
。
但是在閉包的概念中,add_tag
就是一個函式,它需要tag_name
和content
兩個引數,只不過tag_name
這個引數是打包帶走的。所以一開始時就可以告訴我怎麼打包,然後帶走就行。
上面的例子不太生動,其實在我們生活和工作中,閉包的概念也很常見。比如說手機撥號,你只關心電話打給誰,而不會去糾結每個品牌的手機是怎麼實現的,用到了哪些模組。再比如去餐館吃飯,你只要付錢就可以享受到服務,你並不知道那桌飯菜用了多少地溝油。這些都可以看成閉包,返回來的是一些功能或者服務(打電話,用餐),但是這些功能使用了外部變數(天線,地溝油等等)。
你也可以把一個類例項看成閉包,當你在構造這個類時,使用了不同的引數,這些引數就是閉包裡的包,這個類對外提供的方法就是閉包的功能。但是類遠遠大於閉包,因為閉包只是一個可以執行的函式,但是類例項則有可能提供很多方法。
何時使用閉包
其實閉包在Python中很常見,只不過你沒特別注意這就是一個閉包。比如Python中的裝飾器Decorator,假如你需要寫一個帶引數的裝飾器,那麼一般都會生成閉包。
為什麼?因為Python的裝飾器是一個固定的函式介面形式。它要求你的裝飾器函式(或裝飾器類)必須接受一個函式並返回一個函式:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
# how to define def wrapper(func1): # 接受一個callable物件 return func2 # 返回一個物件,一般為函式 # how to use def target_func(args): # 目標函式 pass # 呼叫方式一,直接包裹 result = wrapper(target_func)(args) # 呼叫方式二,使用@語法,等同於方式一 @wrapper def target_func(args): pass result = target_func() |
那麼如果你的裝飾器如果帶引數呢?那麼你就需要在原來的裝飾器上再包一層,用於接收這些引數。這些引數(私貨)傳遞到內層的裝飾器裡後,閉包就形成了。所以說當你的裝飾器需要自定義引數時,一般都會形成閉包。(類裝飾器例外)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
def html_tags(tag_name): def wrapper_(func): def wrapper(*args, **kwargs): content = func(*args, **kwargs) return "<{tag}>{content}</{tag}>".format(tag=tag_name, content=content) return wrapper return wrapper_ @html_tags('b') def hello(name='Toby'): return 'Hello {}!'.format(name) # 不用@的寫法如下 # hello = html_tag('b')(hello) # html_tag('b') 是一個閉包,它接受一個函式,並返回一個函式 print hello() # <b>Hello Toby!</b> print hello('world') # <b>Hello world!</b> |
關於裝飾器的更深入剖析,可以看我寫的另外一篇部落格。
再深入一點
其實也不必太深入,理解這上面的概念,很多看起來頭疼的程式碼也不過如此。
下面讓我們來了解一下閉包的包到底長什麼樣子。其實閉包函式相對與普通函式會多出一個__closure__
的屬性,裡面定義了一個元組用於存放所有的cell
物件,每個cell
物件一一儲存了這個閉包中所有的外部變數。
1 2 3 4 5 6 7 8 9 10 11 12 13 |
>>> def make_printer(msg1, msg2): def printer(): print msg1, msg2 return printer >>> printer = make_printer('Foo', 'Bar') # 形成閉包 >>> printer.__closure__ # 返回cell元組 (<cell at 0x03A10930: str object at 0x039DA218>, <cell at 0x03A10910: str object at 0x039DA488>) >>> printer.__closure__[0].cell_contents # 第一個外部變數 'Foo' >>> printer.__closure__[1].cell_contents # 第二個外部變數 'Bar' |
原理就是這麼簡單。