定義Descriptor並概述其協議,以及展示如何呼叫Descriptor。深入學習自定義Descriptor和幾個內建的Python Descriptor,包括函式、property、靜態方法和類方法。通過純Python程式碼等價實現和應用示例來揭示其執行原理。
物件中屬性訪問的預設行為就是在物件的字典中get、set或delete相應的屬性。例如,a.x的查詢順序是從 a.__dict__[‘x’] 到 type(a).__dict__[‘x’],然後繼續在type(a)除元類(metaclass)外的基類中查詢。如果要查詢的值是定義了任意Descriptor方法的物件,那麼Python會呼叫Descriptor方法來覆蓋預設行為。查詢的優先順序順序取決於定義了哪些Descriptor方法。
1 2 3 4 5 |
descr.__get__(self, obj, type=None) --> value descr.__set__(self, obj, value) --> None descr.__delete__(self, obj) --> None |
同時定義了__get__()和__set__()的物件就叫作Data Descriptor。而只定義了__get__()的Descriptor就被叫做Non-data Descriptor(這種方式就是類方法的典型用法,當然也可能有其他用法)。
Data Descriptor和Non-data Descriptor的不同體現在關於例項字典條目的覆蓋和計算順序上。如果例項字典中包含了與Data Descriptor同名的屬性,那麼Data Descriptor優先。如果例項字典中包含了與Non-data Descriptor同名的屬性,例項字典優先。
同時定義__get__()和__set__()方法,並且__set__()在呼叫時丟擲AttributeError異常,就可以建立一個只讀的Data Descriptor。只需要定義一個丟擲異常的__set__()方法就足以讓該物件成為Data Descriptor。
對於物件來說,其機制是object.__getattribute__()將b.x轉換為type(b).__dict__[‘x’].__get__(b, type(b))。其實現的優先順序鏈是:Data Descriptor優先順序高於例項變數(instance variables),例項變數優先順序高於Non-data Descriptor,而 __getattr__() 的優先順序是最低的。完整的c程式碼實現在Objects/object.c的PyObject_GenericGetAttr()函式中。
對於類來說,其機制是type.__getattribute__()將B.x轉換為B.__dict__[‘x’].__get__(None, B)。純Python的程式碼實現如下:
1 2 3 4 5 6 7 |
def __getattribute__(self, key): "Emulate type_getattro() in Objects/typeobject.c" "模擬Objects/typeobject.c中的type_getattro()" v = object.__getattribute__(self, key) if hasattr(v, '__get__'): return v.__get__(None, self) return v |
- Descriptor是通過__getattribute__()方法來呼叫的
- 覆寫__getattribute__()可以阻止Descriptor的自動呼叫
- object.__getattribute__()和type.__getattribute__()呼叫__get__()的方式不同
- Data Descriptor總是覆蓋例項字典
- Non-data Descriptor可能會被例項字典覆蓋
super()返回的物件也有一個用於呼叫Descriptor的定製__getattribute__()方法。super(B, obj).m()會搜查obj.__class__.__mro__中的基類A,返回A.__dict__[‘m’].__get__(obj, B)。如果不是Descriptor,m返回也是一樣的。如果m不在例項字典中,就還原為通過object.__getattribute__()來搜尋。
下面的程式碼建立了一個Data Descriptor的類,會在get或set時列印一條資訊。覆寫__getattribute__()也可以為每個屬性加上列印資訊。然而,在監控幾個選定的屬性時Descriptor是很用的:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
class RevealAccess(object): """A data descriptor that sets and returns values normally and prints a message logging their access. Data Descriptor在賦值和取值時列印一條記錄訪問的資訊。 """ def __init__(self, initval=None, name='var'): self.val = initval self.name = name def __get__(self, obj, objtype): print('Retrieving', self.name) return self.val def __set__(self, obj, val): print('Updating', self.name) self.val = val >>> class MyClass(object): x = RevealAccess(10, 'var "x"') y = 5 >>> m = MyClass() >>> m.x Retrieving var "x" 10 >>> m.x = 20 Updating var "x" >>> m.x Retrieving var "x" 20 >>> m.y 5 |
呼叫property()是一種簡潔的建立Data Descriptor的方式,會在訪問屬性時觸發函式呼叫。函式簽名如下:
1 |
property(fget=None, fset=None, fdel=None, doc=None) -> property attribute |
1 2 3 4 5 |
class C(object): def getx(self): return self.__x def setx(self, value): self.__x = value def delx(self): del self.__x x = property(getx, setx, delx, "I'm the 'x' property.") |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 |
class Property(object): "Emulate PyProperty_Type() in Objects/descrobject.c" def __init__(self, fget=None, fset=None, fdel=None, doc=None): self.fget = fget self.fset = fset self.fdel = fdel if doc is None and fget is not None: doc = fget.__doc__ self.__doc__ = doc def __get__(self, obj, objtype=None): if obj is None: return self if self.fget is None: raise AttributeError("unreadable attribute") return self.fget(obj) def __set__(self, obj, value): if self.fset is None: raise AttributeError("can't set attribute") self.fset(obj, value) def __delete__(self, obj): if self.fdel is None: raise AttributeError("can't delete attribute") self.fdel(obj) def getter(self, fget): return type(self)(fget, self.fset, self.fdel, self.__doc__) def setter(self, fset): return type(self)(self.fget, fset, self.fdel, self.__doc__) def deleter(self, fdel): return type(self)(self.fget, self.fset, fdel, self.__doc__) |
例如,電子表格類可以授權通過Cell(‘b10’).value訪問單元格的值。對程式的後續變化需要單元格在每次訪問時重新計算;然而,程式設計師不希望影響現有直接訪問屬性的客戶端程式碼。解決方案就是用Property Data Descriptor來封裝對值屬性的訪問:
1 2 3 4 5 6 7 |
class Cell(object): . . . def getvalue(self, obj): "Recalculate cell before returning value" self.recalc() return obj._value value = property(getvalue) |
Python的物件導向特性是建立在以函式為基礎的環境之上的。使用Non-data Descriptor,函式和方法可以無縫地融合起來。
Class字典將方法儲存為函式。在Class的定義中,方法和函式同樣都用def和lambda來定義。方法與函式唯一的不同是其第一個引數預留給物件例項(object instance)的。按照Python的慣例,這個例項引用被稱為self,在其他語言中可能是this或其他名字。
為了支援方法呼叫,函式有__get__()方法,可以在屬性訪問時繫結方法。這意味著所有的函式都是Non-data Descriptor,根據呼叫方是物件或類來返回繫結或非繫結方法。純Python實現如下:
1 2 3 4 5 |
class Function(object): . . . def __get__(self, obj, objtype=None): "Simulate func_descr_get() in Objects/funcobject.c" return types.MethodType(self, obj, objtype) |
1 2 3 4 5 6 7 8 9 10 11 |
>>> class D(object): def f(self, x): return x >>> d = D() >>> D.__dict__['f'] # Stored internally as a function <function f at 0x00C45070> >>> D.f # Get from a class becomes an unbound method <unbound method D.f> >>> d.f # Get from an instance becomes a bound method <bound method D.f of <__main__.D object at 0x00B18C90>> |
上面的輸出資訊表示繫結和非繫結方法是兩種不同的型別。儘管我們可以用上述方式實現,但是在Objects/classobject.c 中的 PyMethod_Type 其實是用一個物件實現的,只是這個物件存在兩種不同的表現形式,而表現形式則取決於 im_self 的值是否為空(在 C 語言中表示 None 的關鍵字為 NULL)。
Non-data descriptor為函式繫結到方法的常用模式中提供了一個簡單的變化機制。
總的來說,函式有__get__()方法,因此在當作屬性訪問時會轉換為方法。Non-data Descriptor將obj.f(*args)變成f(obj, *args),將klass.f(*args)變成f(*args)。
Transformation Called from an Object Called from a Class function f(obj, *args) f(*args) staticmethod f(*args) f(*args) classmethod f(type(obj), *args) f(klass, *args)
靜態方法返回沒有任何變化的原函式。呼叫c.f或C.f相當於直接查詢object.__getattribute__(c, “f”)或object.__getattribute__(C, “f”)。因此,函式通過物件或類來呼叫是等價的。
例如,統計學的package可以包含存放實驗資料的容器類。這個類提供了標準的方法,計算平均值、均值、中值和其他依賴資料的描述性統計。然而,可能有隻是概念相關但不依賴資料的函式。例如,erf(x)是在統計工作中方便的轉換程式,但是不直接依賴特定的資料集。可以通過物件或類來呼叫:s.erf(1.5) –> .9332或Sample.erf(1.5) –> .9332。
1 2 3 4 5 6 7 8 9 |
>>> class E(object): def f(x): print(x) f = staticmethod(f) >>> print(E.f(3)) 3 >>> print(E().f(3)) 3 |
使用Non-data Descriptor協議,staticmethod()的純Python版本如下:
1 2 3 4 5 6 7 8 |
class StaticMethod(object): "Emulate PyStaticMethod_Type() in Objects/funcobject.c" def __init__(self, f): self.f = f def __get__(self, obj, objtype=None): return self.f |
1 2 3 4 5 6 7 8 9 |
>>> class E(object): def f(klass, x): return klass.__name__, x f = classmethod(f) >>> print(E.f(3)) ('E', 3) >>> print(E().f(3)) ('E', 3) |
當函式僅需要類引用並且不關心任何內部資料時,類方法是非常有用的。類方法的一個用途就是代替類建構函式來建立物件。在Python 2.3中,類方法dict.fromkeys()通過鍵值列表來建立新字典。等價的純Python實現如下:
1 2 3 4 5 6 7 8 9 |
class Dict(object): . . . def fromkeys(klass, iterable, value=None): "Emulate dict_fromkeys() in Objects/dictobject.c" d = klass() for key in iterable: d[key] = value return d fromkeys = classmethod(fromkeys) |
1 2 |
>>> Dict.fromkeys('abracadabra') {'a': None, 'r': None, 'b': None, 'c': None, 'd': None} |
使用Non-data Descriptor協議,classmethod()的純Python版本如下:
1 2 3 4 5 6 7 8 9 10 11 12 |
class ClassMethod(object): "Emulate PyClassMethod_Type() in Objects/funcobject.c" def __init__(self, f): self.f = f def __get__(self, obj, klass=None): if klass is None: klass = type(obj) def newfunc(*args): return self.f(klass, *args) return newfunc |