淺析 Python 的類、繼承和多型

發表於2017-07-15

類的定義

假如要定義一個類 Point,表示二維的座標點:

最最基本的就是 __init__ 方法,相當於 C++ / Java 的建構函式。帶雙下劃線 __ 的方法都是特殊方法,除了 __init__ 還有很多,後面會有介紹。

引數 self 相當於 C++ 的 this,表示當前例項,所有方法都有這個引數,但是呼叫時並不需要指定。

幾乎所有的特殊方法(包括 __init__)都是隱式呼叫的(不直接呼叫)。

對一切皆物件的 Python 來說,類自己當然也是物件:

Pointtype 的一個例項,這和 pPoint 的一個例項是一回事。

現新增方法 set

p.set(...) 其實只是一個語法糖,你也可以寫成 Point.set(p, ...),這樣就能明顯看出 p 就是 self 引數了:

值得注意的是,self 並不是關鍵字,甚至可以用其它名字替代,比如 this

與 C++ 不同的是,“成員變數”必須要加 self. 字首,否則就變成類的屬性(相當於 C++ 靜態成員),而不是物件的屬性了。

訪問控制

Python 沒有 public / protected / private 這樣的訪問控制,如果你非要表示“私有”,習慣是加雙下劃線字首。

__x__y__f 就相當於私有了:

_repr_

嘗試列印 Point 例項:

通常,這並不是我們想要的輸出,我們想要的是:

新增特殊方法 __repr__ 即可實現:

不難看出,互動模式在列印 p 時其實是呼叫了 repr(p)

_str_

如果沒有提供 __str__str() 預設使用 repr() 的結果。
這兩者都是物件的字串形式的表示,但還是有點差別的。簡單來說,repr() 的結果面向的是直譯器,通常都是合法的 Python 程式碼,比如 Point(10, 10);而 str() 的結果面向使用者,更簡潔,比如 (10, 10)

按照這個原則,我們為 Point 提供 __str__ 的定義如下:

_add_

兩個座標點相加是個很合理的需求。

新增特殊方法 __add__ 即可做到:

這就像 C++ 裡的操作符過載一樣。
Python 的內建型別,比如字串、列表,都“過載”了 + 操作符。

特殊方法還有很多,這裡就不逐一介紹了。

繼承

舉一個教科書中最常見的例子。CircleRectangle 繼承自 Shape,不同的圖形,面積(area)計算方式不同。

用法比較直接:

如果 Circle 沒有定義自己的 area

那麼它將繼承父類 Shapearea

一旦 Circle 定義了自己的 area,從 Shape 繼承而來的那個 area 就被重寫(overwrite)了:

通過類的字典更能明顯地看清這一點:

所以,子類重寫父類的方法,其實只是把相同的屬性名繫結到了不同的函式物件。可見 Python 是沒有覆寫(override)的概念的。

同理,即使 Shape 沒有定義 area 也是可以的,Shape 作為“介面”,並不能得到語法的保證。

甚至可以動態的新增方法:

動態語言一般都是這麼靈活,Python 也不例外。

Python 官方教程「9. Classes」第一句就是:

Compared with other programming languages, Python’s class mechanism adds classes with a minimum of new syntax and semantics.

Python 以最少的新的語法和語義實現了類機制,這一點確實讓人驚歎,但是也讓 C++ / Java 程式設計師感到頗為不適。

多型

如前所述,Python 沒有覆寫(override)的概念。嚴格來講,Python 並不支援「多型」。

為了解決繼承結構中介面和實現的問題,或者說為了更好的用 Python 面向介面程式設計(設計模式所提倡的),我們需要人為的設一些規範。

請考慮 Shape.area() 除了簡單的返回 0.0,有沒有更好的實現?

以內建模組 asyncio 為例,AbstractEventLoop 原則上是一個介面,類似於 Java 中的介面或 C++ 中的純虛類,但是 Python 並沒有語法去保證這一點,為了儘量體現 AbstractEventLoop 是一個介面,首先在名字上標誌它是抽象的(Abstract),然後讓每個方法都丟擲異常 NotImplementedError

縱然如此,你是無法禁止使用者例項化 AbstractEventLoop 的:

C++ 可以通過純虛擬函式或設建構函式為 protected 來避免介面被例項化,Java 就更不用說了,介面就是介面,有完整的語法支援。

你也無法強制子類必須實現“介面”中定義的每一個方法,C++ 的純虛擬函式可以強制這一點(Java 更不必說)。

就運算元類「自以為」實現了“介面”中的方法,也不能保證方法的名字沒有寫錯,C++ 的 override 關鍵字可以保證這一點(Java 更不必說)。

靜態型別的缺失,讓 Python 很難實現 C++ / Java 那樣嚴格的多型檢查機制。所以面向介面的程式設計,對 Python 來說,更多的要依靠程式設計師的素養。

回到 Shape 的例子,仿照 asyncio,我們把“介面”改成這樣:

這樣,它才更像一個介面。

super

有時候,需要在子類中呼叫父類的方法。

比如圖形都有顏色這個屬性,所以不妨加一個引數 color__init__

那麼子類的 __init__() 勢必也要跟著改動:

通過 supercolor 傳給父類的 __init__()。其實不用 super 也行:

但是 super 是推薦的做法,因為它避免了硬編碼,也能處理多繼承的情況。

相關文章