Python模組學習:zipfile zip檔案操作

發表於2015-05-27

最近在寫一個網路客戶端下載程式,用於下載伺服器上的資料。有些資料(如文字,office文件)如果直接傳輸的話,將會增加通訊的資料量,使下載時間變長。伺服器在傳輸這些資料之前先對其進行壓縮,客戶端接收到資料之後進行解壓,這樣可以減小網通傳輸資料的通訊量,縮短下載的時間,從而增加客戶體驗。以前用C#做類似應用程式的時候,我會用SharpZipLib這個開源元件,現在用Python做類似的工作,只要使用zipfile模組提供的api就可以輕鬆的完成。

zip檔案格式是通用的文件壓縮標準,在ziplib模組中,使用ZipFile類來操作zip檔案,下面具體介紹一下:

class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])

建立一個ZipFile物件,表示一個zip檔案。引數file表示檔案的路徑或類檔案物件(file-like object);引數mode指示開啟zip檔案的模式,預設值為’r’,表示讀已經存在的zip檔案,也可以為’w’或’a’,’w’表示新建一個zip文件或覆蓋一個已經存在的zip文件,’a’表示將資料附加到一個現存的zip文件中。引數compression表示在寫zip文件時使用的壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。如果要操作的zip檔案大小超過2G,應該將allowZip64設定為True。

ZipFile還提供瞭如下常用的方法和屬性:

ZipFile.getinfo(name):

  獲取zip文件內指定檔案的資訊。返回一個zipfile.ZipInfo物件,它包括檔案的詳細資訊。將在下面 具體介紹該物件。

ZipFile.infolist()

獲取zip文件內所有檔案的資訊,返回一個zipfile.ZipInfo的列表。

ZipFile.namelist()

獲取zip文件內所有檔案的名稱列表。

ZipFile.extract(member[, path[, pwd]])

將zip文件內的指定檔案解壓到當前目錄。引數member指定要解壓的檔名稱或對應的ZipInfo物件;引數path指定了解析檔案儲存的資料夾;引數pwd為解壓密碼。下面一個例子將儲存在程式根目錄下的txt.zip內的所有檔案解壓到D:/Work目錄:

ZipFile.extractall([path[, members[, pwd]]])

解壓zip文件中的所有檔案到當前目錄。引數members的預設值為zip文件內的所有檔名稱列表,也可以自己設定,選擇要解壓的檔名稱。

ZipFile.printdir()

將zip文件內的資訊列印到控制檯上。

ZipFile.setpassword(pwd)

設定zip文件的密碼。

ZipFile.read(name[, pwd])

獲取zip文件內指定檔案的二進位制資料。下面的例子演示了read()的使用,zip文件內包括一個txt.txt的文字檔案,使用read()方法讀取其二進位制資料,然後儲存到D:/txt.txt。

ZipFile.write(filename[, arcname[, compress_type]])

將指定檔案新增到zip文件中。filename為檔案路徑,arcname為新增到zip文件之後儲存的名稱, 引數compress_type表示壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。下面的例子演示瞭如何建立一個zip文件,並將檔案D:/test.doc新增到壓縮文件中。

ZipFile.writestr(zinfo_or_arcname, bytes)

writestr()支援將二進位制資料直接寫入到壓縮文件。

Class ZipInfo

ZipFile.getinfo(name) 方法返回的是一個ZipInfo物件,表示zip文件中相應檔案的資訊。它支援如下屬性:

ZipInfo.filename: 獲取檔名稱。
ZipInfo.date_time: 獲取檔案最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)
ZipInfo.compress_type: 壓縮型別。
ZipInfo.comment: 文件說明。
ZipInfo.extr: 擴充套件項資料。
ZipInfo.create_system: 獲取建立該zip文件的系統。
ZipInfo.create_version: 獲取 建立zip文件的PKZIP版本。
ZipInfo.extract_version: 獲取 解壓zip文件所需的PKZIP版本。
ZipInfo.reserved: 預留欄位,當前實現總是返回0。
ZipInfo.flag_bits: zip標誌位。
ZipInfo.volume: 檔案頭的卷標。
ZipInfo.internal_attr: 內部屬性。
ZipInfo.external_attr: 外部屬性。
ZipInfo.header_offset: 檔案頭偏移位。
ZipInfo.CRC: 未壓縮檔案的CRC-32。
ZipInfo.compress_size: 獲取壓縮後的大小。
ZipInfo.file_size: 獲取未壓縮的檔案大小。

下面一個簡單的例子說明這些屬性的意思:

感覺使用zipfile模組來處理zip檔案真的很簡單。想當初在.NET平臺下,使用sharpziplib壓縮、解壓一個檔案,我花了N多時間,找了N多英文資源,才寫出一個能壓縮檔案的demo。而現在使用Python,通過閱讀python手冊,一兩個小時就掌握了zipfile模組的基本使用。哈哈,使用Python,真爽!

相關文章