最近在寫一個網路客戶端下載程式,用於下載伺服器上的資料。有些資料(如文字,office文件)如果直接傳輸的話,將會增加通訊的資料量,使下載時間變長。伺服器在傳輸這些資料之前先對其進行壓縮,客戶端接收到資料之後進行解壓,這樣可以減小網通傳輸資料的通訊量,縮短下載的時間,從而增加客戶體驗。以前用C#做類似應用程式的時候,我會用SharpZipLib這個開源元件,現在用Python做類似的工作,只要使用zipfile模組提供的api就可以輕鬆的完成。
zip檔案格式是通用的文件壓縮標準,在ziplib模組中,使用ZipFile類來操作zip檔案,下面具體介紹一下:
class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
建立一個ZipFile物件,表示一個zip檔案。引數file表示檔案的路徑或類檔案物件(file-like object);引數mode指示開啟zip檔案的模式,預設值為’r’,表示讀已經存在的zip檔案,也可以為’w’或’a’,’w’表示新建一個zip文件或覆蓋一個已經存在的zip文件,’a’表示將資料附加到一個現存的zip文件中。引數compression表示在寫zip文件時使用的壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。如果要操作的zip檔案大小超過2G,應該將allowZip64設定為True。
ZipFile還提供瞭如下常用的方法和屬性:
ZipFile.getinfo(name):
獲取zip文件內指定檔案的資訊。返回一個zipfile.ZipInfo物件,它包括檔案的詳細資訊。將在下面 具體介紹該物件。
ZipFile.infolist()
獲取zip文件內所有檔案的資訊,返回一個zipfile.ZipInfo的列表。
ZipFile.namelist()
獲取zip文件內所有檔案的名稱列表。
ZipFile.extract(member[, path[, pwd]])
將zip文件內的指定檔案解壓到當前目錄。引數member指定要解壓的檔名稱或對應的ZipInfo物件;引數path指定了解析檔案儲存的資料夾;引數pwd為解壓密碼。下面一個例子將儲存在程式根目錄下的txt.zip內的所有檔案解壓到D:/Work目錄:
1 2 3 4 5 |
import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip')) for file in zipFile.namelist(): zipFile.extract(file, r'd:/Work') zipFile.close() |
ZipFile.extractall([path[, members[, pwd]]])
解壓zip文件中的所有檔案到當前目錄。引數members的預設值為zip文件內的所有檔名稱列表,也可以自己設定,選擇要解壓的檔名稱。
ZipFile.printdir()
將zip文件內的資訊列印到控制檯上。
ZipFile.setpassword(pwd)
設定zip文件的密碼。
ZipFile.read(name[, pwd])
獲取zip文件內指定檔案的二進位制資料。下面的例子演示了read()的使用,zip文件內包括一個txt.txt的文字檔案,使用read()方法讀取其二進位制資料,然後儲存到D:/txt.txt。
1 2 3 4 5 6 |
#coding=gbk import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip')) data = zipFile.read('txt.txt') (lambda f, d: (f.write(d), f.close()))(open(r'd:/txt.txt', 'wb'), data) #一行語句就完成了寫檔案操作。仔細琢磨哦~_~ zipFile.close() |
ZipFile.write(filename[, arcname[, compress_type]])
將指定檔案新增到zip文件中。filename為檔案路徑,arcname為新增到zip文件之後儲存的名稱, 引數compress_type表示壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。下面的例子演示瞭如何建立一個zip文件,並將檔案D:/test.doc新增到壓縮文件中。
1 2 3 4 |
import zipfile, os zipFile = zipfile.ZipFile(r'D:/test.zip'), 'w') zipFile.write(r'D:/test.doc', 'ok.doc', zipfile.ZIP_DEFLATED) zipFile.close() |
ZipFile.writestr(zinfo_or_arcname, bytes)
writestr()支援將二進位制資料直接寫入到壓縮文件。
Class ZipInfo
ZipFile.getinfo(name) 方法返回的是一個ZipInfo物件,表示zip文件中相應檔案的資訊。它支援如下屬性:
ZipInfo.filename: 獲取檔名稱。
ZipInfo.date_time: 獲取檔案最後修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)
ZipInfo.compress_type: 壓縮型別。
ZipInfo.comment: 文件說明。
ZipInfo.extr: 擴充套件項資料。
ZipInfo.create_system: 獲取建立該zip文件的系統。
ZipInfo.create_version: 獲取 建立zip文件的PKZIP版本。
ZipInfo.extract_version: 獲取 解壓zip文件所需的PKZIP版本。
ZipInfo.reserved: 預留欄位,當前實現總是返回0。
ZipInfo.flag_bits: zip標誌位。
ZipInfo.volume: 檔案頭的卷標。
ZipInfo.internal_attr: 內部屬性。
ZipInfo.external_attr: 外部屬性。
ZipInfo.header_offset: 檔案頭偏移位。
ZipInfo.CRC: 未壓縮檔案的CRC-32。
ZipInfo.compress_size: 獲取壓縮後的大小。
ZipInfo.file_size: 獲取未壓縮的檔案大小。
下面一個簡單的例子說明這些屬性的意思:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 |
import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip')) zipInfo = zipFile.getinfo('doc.doc') print 'filename:', zipInfo.filename print 'date_time:', zipInfo.date_time print 'compress_type:', zipInfo.compress_type print 'comment:', zipInfo.comment print 'extra:', zipInfo.extra print 'create_system:', zipInfo.create_system print 'create_version:', zipInfo.create_version print 'extract_version:', zipInfo.extract_version print 'extract_version:', zipInfo.reserved print 'flag_bits:', zipInfo.flag_bits print 'volume:', zipInfo.volume print 'internal_attr:', zipInfo.internal_attr print 'external_attr:', zipInfo.external_attr print 'header_offset:', zipInfo.header_offset print 'CRC:', zipInfo.CRC print 'compress_size:', zipInfo.compress_size print 'file_size:', zipInfo.file_size zipFile.close() |
感覺使用zipfile模組來處理zip檔案真的很簡單。想當初在.NET平臺下,使用sharpziplib壓縮、解壓一個檔案,我花了N多時間,找了N多英文資源,才寫出一個能壓縮檔案的demo。而現在使用Python,通過閱讀python手冊,一兩個小時就掌握了zipfile模組的基本使用。哈哈,使用Python,真爽!