用C語言擴充套件Python的功能

發表於2016-05-22

一、簡介

Python是一門功能強大的高階指令碼語言,它的強大不僅表現在其自身的功能上,而且還表現在其良好的可擴充套件性上,正因如此,Python已經開始受到越來越多人的青睞,並且被屢屢成功地應用於各類大型軟體系統的開發過程中。

與其它普通指令碼語言有所不同,Python程式設計師可以藉助Python語言提供的API,使用C或者C++來對Python進行功能性擴充套件,從而即可以利用Python方便靈活的語法和功能,又可以獲得與C或者C++幾乎相同的執行效能。執行速度慢是幾乎所有指令碼語言都具有的共性,也是倍受人們指責的一個重要因素,Python則通過與C語言的有機結合巧妙地解決了這一問題,從而使指令碼語言的應用範圍得到了很大擴充套件。

在用Python開發實際軟體系統時,很多時候都需要使用C/C++來對Python進行擴充套件。最常見的情況是目前已經存在一個用C編寫的庫,需要在Python語言中使用該庫的某些功能,此時就可以藉助Python提供的擴充套件功能來實現。此外,由於Python從本質上講還是一種指令碼語言,某些功能用Python實現可能很難滿足實際軟體系統對執行效率的要求,此時也可以藉助Python提供的擴充套件功能,將這些關鍵程式碼段用C或者C++實現,從而提供程式的執行效能。

本文主要介紹Python提供的C語言擴充套件介面,以及如何使用這些介面和C/C++語言來對Python進行功能性擴充套件,並輔以具體的例項講述如何實現Python的功能擴充套件。


二、Python的C語言介面

Python是用C語言實現的一種指令碼語言,本身具有優良的開放性和可擴充套件性,並提供了方便靈活的應用程式介面(API),從而使得C/C++程式設計師能夠在各個級別上對Python直譯器的功能進行擴充套件。在使用C/C++對Python進行功能擴充套件之前,必須首先掌握Python解釋所提供的C語言介面。

2.1 Python物件(PyObject)

Python是一門物件導向的指令碼語言,所有的物件在Python直譯器中都被表示成PyObject,PyObject結構包含Python物件的所有成員指標,並且對Python物件的型別資訊和引用計數進行維護。在進行Python的擴充套件程式設計時,一旦要在C或者C++中對Python物件進行處理,就意味著要維護一個PyObject結構。

在Python的C語言擴充套件介面中,大部分函式都有一個或者多個引數為PyObject指標型別,並且返回值也大都為PyObject指標。

2.2 引用計數

為了簡化記憶體管理,Python通過引用計數機制實現了自動的垃圾回收功能,Python中的每個物件都有一個引用計數,用來計數該物件在不同場所分別被引用了多少次。每當引用一次Python物件,相應的引用計數就增1,每當消毀一次Python物件,則相應的引用就減1,只有當引用計數為零時,才真正從記憶體中刪除Python物件。

下面的例子說明了Python直譯器如何利用引用計數來對Pyhon物件進行管理:

在C/C++中處理Python物件時,對引用計數進行正確的維護是一個關鍵問題,處理不好將很容易產生記憶體洩漏。Python的C語言介面提供了一些巨集來對引用計數進行維護,最常見的是用Py_INCREF()來增加使Python物件的引用計數增1,用Py_DECREF()來使Python物件的引用計數減1。

2.3 資料型別

Python定義了六種資料型別:整型、浮點型、字串、元組、列表和字典,在使用C語言對Python進行功能擴充套件時,首先要了解如何在C和Python的資料型別間進行轉化。

2.3.1 整型、浮點型和字串

在Python的C語言擴充套件中要用到整型、浮點型和字串這三種資料型別時相對比較簡單,只需要知道如何生成和維護它們就可以了。下面的例子給出瞭如何在C語言中使用Python的這三種資料型別:

2.3.2 元組

Python語言中的元組是一個長度固定的陣列,當Python直譯器呼叫C語言擴充套件中的方法時,所有非關鍵字(non-keyword)引數都以元組方式進行傳遞。下面的例子示範瞭如何在C語言中使用Python的元組型別:

2.3.3 列表

Python語言中的列表是一個長度可變的陣列,列表比元組更為靈活,使用列表可以對其儲存的Python物件進行隨機訪問。下面的例子示範瞭如何在C語言中使用Python的列表型別:

2.3.4 字典

Python語言中的字典是一個根據關鍵字進行訪問的資料型別。下面的例子示範瞭如何在C語言中使用Python的字典型別:


三、Python的C語言擴充套件

3.1 模組封裝

在瞭解了Python的C語言介面後,就可以利用Python直譯器提供的這些介面來編寫Python的C語言擴充套件,假設有如下一個C語言函式:

該函式的功能是計算某個給定自然數的階乘,如果想在Python直譯器中呼叫該函式,則應該首先將其實現為Python中的一個模組,這需要編寫相應的封裝介面,如下所示:

一個典型的Python擴充套件模組至少應該包含三個部分:匯出函式、方法列表和初始化函式。

3.2 匯出函式

要在Python直譯器中使用C語言中的某個函式,首先要為其編寫相應的匯出函式,上述例子中的匯出函式為wrap_fact。在Python的C語言擴充套件中,所有的匯出函式都具有相同的函式原型:

該函式是Python直譯器和C函式進行互動的介面,帶有兩個引數:self和args。引數self只在C函式被實現為內聯方法(built-in method)時才被用到,通常該引數的值為空(NULL)。引數args中包含了Python直譯器要傳遞給C函式的所有引數,通常使用Python的C語言擴充套件介面提供的函式PyArg_ParseTuple()來獲得這些引數值。

所有的匯出函式都返回一個PyObject指標,如果對應的C函式沒有真正的返回值(即返回值型別為void),則應返回一個全域性的None物件(Py_None),並將其引用計數增1,如下所示:

3.3 方法列表

方法列表中給出了所有可以被Python直譯器使用的方法,上述例子對應的方法列表為:

方法列表中的每項由四個部分組成:方法名、匯出函式、引數傳遞方式和方法描述。方法名是從Python直譯器中呼叫該方法時所使用的名字。引數傳遞方式則規定了Python向C函式傳遞引數的具體形式,可選的兩種方式是METH_VARARGS和METH_KEYWORDS,其中METH_VARARGS是引數傳遞的標準形式,它通過Python的元組在Python直譯器和C函式之間傳遞引數,若採用METH_KEYWORD方式,則Python直譯器和C函式之間將通過Python的字典型別在兩者之間進行引數傳遞。

3.4 初始化函式

所有的Python擴充套件模組都必須要有一個初始化函式,以便Python直譯器能夠對模組進行正確的初始化。Python直譯器規定所有的初始化函式的函式名都必須以init開頭,並加上模組的名字。對於模組example來說,則相應的初始化函式為:

當Python直譯器需要匯入該模組時,將根據該模組的名稱查詢相應的初始化函式,一旦找到則呼叫該函式進行相應的初始化工作,初始化函式則通過呼叫Python的C語言擴充套件介面所提供的函式Py_InitModule(),來向Python直譯器註冊該模組中所有可以用到的方法。

3.5 編譯連結

要在Python直譯器中使用C語言編寫的擴充套件模組,必須將其編譯成動態連結庫的形式。下面以RedHat Linux 8.0為例,介紹如何將C編寫的Python擴充套件模組編譯成動態連結庫:

3.6 引入Python直譯器

當生成Python擴充套件模組的動態連結庫後,就可以在Python直譯器中使用該擴充套件模組了,與Python自帶的模組一樣,擴充套件模組也是通過import命令引入後再使用的,如下所示:


四、結束語

作為一門功能強大的指令碼語言,Python將被更加廣泛地應用於各個領域。為了克服指令碼語言執行速度慢的問題,Python提供了相應的C語言擴充套件介面,通過將影響執行效能的關鍵程式碼用C語言實現,可以很大程度上提高用Python編寫的指令碼在執行時的速度,從而滿足實際需要。

參考資料

  1. 可以從Python( http://www.python.org)網站著手瞭解所有關於Python的內容。
  2. 可以在Python網站上找到正式的Python C/API文件( http://www.python.org/doc/current/api/api.html)。
  3. 可以在Python網站上找到正式的編寫Python擴充套件模組的文件( http://www.python.org/doc/current/api/api.html)。

相關文章