Python 快速教程(標準庫):走馬觀花

發表於2015-11-06

Python有一套很有用的標準庫(standard library)。標準庫會隨著Python直譯器,一起安裝在你的電腦中的。它是Python的一個組成部分。這些標準庫是Python為你準備好的利器,可以讓程式設計事半功倍。

 

我將根據我個人的使用經驗中,挑選出標準庫三個方面的包(package)介紹:

  • Python增強
  • 系統互動
  • 網路

 

第一類:Python增強

Python自身的已有的一些功能可以隨著標準庫的使用而得到增強。

 

1) 文書處理

Python的string類提供了對字串進行處理的方法。更進一步,通過標準庫中的re包,Python可以用正規表示式(regular expression)來處理字串。

正規表示式是一個字串模板。Python可以從字元中搜查符合該模板的部分,或者對這一部分替換成其它內容。比如你可以搜尋一個文字中所有的數字。正規表示式的關鍵在於根據自己的需要構成模板。

此外,Python標準庫還為字串的輸出提供更加豐富的格式, 比如: string包,textwrap包。

 

2) 資料物件

不同的資料物件,適用於不同場合的對資料的組織和管理。Python的標準庫定義了表和詞典之外的資料物件,比如說陣列(array),佇列(Queue)。一個熟悉資料結構(data structure)的Python使用者可以在這些包中找到自己需要的資料結構。

此外,我們也會經常使用copy包,以複製物件。

 

3) 日期和時間

日期和時間的管理並不複雜,但容易犯錯。Python的標準庫中對日期和時間的管理頗為完善(利用time包管理時間,利用datetime包管理日期和時間),你不僅可以進行日期時間的查詢和變換(比如:2012年7月18日對應的是星期幾),還可以對日期時間進行運算(比如2000.1.1 13:00的378小時之後是什麼日期,什麼時間)。通過這些標準庫,還可以根據需要控制日期時間輸出的文字格式(比如:輸出’2012-7-18‘還是’18 Jul 2012′)

 

4) 數學運算

標準庫中,Python定義了一些新的數字型別(decimal包, fractions包), 以彌補之前的數字型別(integer, float)可能的不足。標準庫還包含了random包,用於處理隨機數相關的功能(產生隨機數,隨機取樣等)。math包補充了一些重要的數學常數和數學函式,比如pi,三角函式等等。

(儘管numpy並不是標準庫中的包,但它的陣列運算的良好支援,讓它在基於Python的科研和計算方面得到相當廣泛的應用,可以適當關注。)

 

5) 儲存

之前我們的快速教程中,只提及了文字的輸入和輸出。實際上,Python可以輸入或輸出任意的物件。這些物件可以通過標準庫中的pickle包轉換成為二進位制格式(binary),然後儲存於檔案之中,也可以反向從二進位制檔案中讀取物件。

此外,標準庫中還支援基本的資料庫功能(sqlite3包)。XML和csv格式的檔案也有相應的處理包。

第二類:系統互動

系統互動,主要指Python和作業系統(operate system)、檔案系統(file system)的互動。Python可以實現一個作業系統的許多功能。它能夠像bash指令碼那樣管理作業系統,這也是Python有時被成為指令碼語言的原因。

 

1) Python執行控制

sys包被用於管理Python自身的執行環境。Python是一個直譯器(interpreter), 也是一個執行在作業系統上的程式。我們可以用sys包來控制這一程式執行的許多引數,比如說Python執行所能佔據的記憶體和CPU, Python所要掃描的路徑等。另一個重要功能是和Python自己的命令列互動,從命令列讀取命令和引數。

 

2) 作業系統

如果說Python構成了一個小的世界,那麼作業系統就是包圍這個小世界的大世界。Python與作業系統的互動可以讓Python在自己的小世界裡管理整個大世界。

os包是Python與作業系統的介面。我們可以用os包來實現作業系統的許多功能,比如管理系統程式,改變當前路徑(相當於’cd‘),改變檔案許可權等,建立。但要注意,os包是建立在作業系統的平臺上的,許多功能在Windows系統上是無法實現的。另外,在使用os包中,要注意其中的有些功能已經被其他的包取代。

我們通過檔案系統來管理磁碟上儲存的檔案。查詢、刪除,複製檔案,以及列出檔案列表等都是常見的檔案操作。這些功能經常可以在作業系統中看到(比如ls, mv, cp等Linux命令),但現在可以通過Python標準庫中的glob包、shutil包、os.path包、以及os包的一些函式等,在Python內部實現。

subprocess包被用於執行外部命令,其功能相當於我們在作業系統的命令列中輸入命令以執行,比如常見的系統命令’ls’或者’cd’,還可以是任意可以在命令列中執行的程式。

 

4) 執行緒與程式

Python支援多執行緒(threading包)執行和多程式(multiprocessing包)執行。通過多執行緒和多程式,可以提高系統資源的利用率,提高計算機的處理速度。Python在這些包中,附帶有相關的通訊和記憶體管理工具。此外,Python還支援類似於UNIX的signal系統,以實現程式之間的粗糙的訊號通訊。

 

第三類:網路

現在,網路功能的強弱很大程度上決定了一個語言的成功與否。從Ruby, JavaScript, php身上都可以感受到這一點。Python的標準庫對網際網路開發的支援並不充分,這也是Django等基於Python的專案的出發點: 增強Python在網路方面的應用功能。這些專案取得了很大的成功,也是許多人願意來學習Python的一大原因。但應注意到,這些基於Python的專案也是建立在Python標準庫的基礎上的。

 

1) 基於socket層的網路應用

socket是網路可程式設計部分的底層。通過socket包,我們可以直接管理socket,比如說將socket賦予給某個埠(port),連線遠端埠,以及通過連線傳輸資料。我們也可以利用SocketServer包更方便地建立伺服器。

通過與多執行緒和多程式配合,建立多執行緒或者多程式的伺服器,可以有效提高伺服器的工作能力。此外,通過asyncore包實現非同步處理,也是改善伺服器效能的一個方案。

 

2) 網際網路應用

在實際應用中,網路的很多底層細節(比如socket)都是被高層的協議隱藏起來的。建立在socket之上的http協議實際上更容易也更經常被使用。http通過request/responce的模式建立連線並進行通訊,其資訊內容也更容易理解。Python標準庫中有http的伺服器端和客戶端的應用支援(BaseHTTPServer包; urllib包, urllib2包), 並且可以通過urlparse包對URL(URL實際上說明了網路資源所在的位置)進行理解和操作。

 

以上的介紹比較粗糙,只希望能為大家提供一個瞭解標準庫的入口。歡迎大家一起分享標準庫的使用經驗。

相關文章