壓縮和解壓縮是日常常用的操作,不管是windows上圖形介面的操作,還是linux上用命令來進行壓縮解壓縮,總的而言都還是比較方便的。
但用程式碼來實現就沒做過,近期也得實現程式碼壓縮與解壓縮操作,所以就抽時間來研究一下。
一、zip檔案壓縮和解壓縮實現
import os
import zipfile
# 函式功能是zip_file_list所有檔案,和zip_dir_list所有目錄下的所有檔案,被壓縮到一個zip_file_name的壓縮檔案中
def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
# 壓縮檔案最後需要close,為了方便我們直接用with
with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
# 壓縮檔案
for tmp_file in zip_file_list:
zip_obj.write(tmp_file)
# 壓縮目錄
for tmp_dir in zip_dir_list:
# zipfile沒有直接壓縮目錄的功能,要壓縮目錄只能遍歷目錄一個一個檔案壓。
for root, dirs, files in os.walk(tmp_dir):
# 如果想要目錄為空時仍將該目錄壓縮排去,該目錄也要壓縮一遍;反之請將以下行註釋掉
zip_obj.write(root)
for tmp_file in files:
# 拼接檔案完整目錄,不然只用檔名程式碼找不到檔案
tmp_file_path = os.path.join(root, tmp_file)
zip_obj.write(tmp_file_path)
# 函式功能是遍歷壓縮檔案中的所有檔案
def my_traversal_zip_function(zip_file_name):
with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
# 返回結果是一個ZipInfo列表
# 如果在壓縮時顯示壓縮目錄,則目錄也作為一個單獨的ZipInfo呈現在列表中;反之則沒有目錄的ZipInfo
all_file_list = zip_obj.infolist()
for tmp_file in all_file_list:
print(tmp_file.filename)
# 還可以在不解壓的情況下直接讀取檔案的內容
# 可以透過ZipInfo.is_dir()來區分是檔案還是目錄
# if not tmp_file.is_dir():
# with zip_obj.open(tmp_file) as zip_fd:
# print(zip_fd.read())
# 函式的功能是將壓縮檔案直接解壓
def my_unzip_function(zip_file_name, path="."):
with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
zip_obj.extractall(path=path)
if __name__ == "__main__":
zip_file_name = "test_zip.zip"
# 自己在測試時要先自行建立好要壓縮的檔案和目錄
zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
zip_dir_list = ["test_tar_dir"]
my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
my_traversal_zip_function(zip_file_name)
# my_unzip_function(zip_file_name, path=".")
二、tar檔案的壓縮與解壓縮實現
除了直接的.tar檔案,還包括.tar.gz/.tar.bz2/.tar.xz等格式檔案的壓縮與解壓縮實現。
import os
import tarfile
# 函式功能是tar_file_list所有檔案,和tar_dir_list所有目錄下的所有檔案,被壓縮到一個tar_file_name的壓縮檔案中
def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
# 本來也應該是tarfile.TarFile(tar_file_name, model)來建立的,但TarFile不支援"r:gz"等擴充套件形式
# 壓縮檔案最後需要close,為了方便我們直接用with
with tarfile.open(tar_file_name, model) as tar_obj:
# 壓縮檔案
for tmp_file in tar_file_list:
tar_obj.add(tmp_file)
# 壓縮目錄。和zipfile相比tarfile允許直接壓縮目錄,而不需要去遍歷目錄一個個檔案壓
for tmp_dir in tar_dir_list:
tar_obj.add(tmp_dir)
# 函式功能是遍歷壓縮檔案中的所有檔案
def my_traversal_tar_function(tar_file_name, model="r"):
with tarfile.open(tar_file_name, model) as tar_obj:
# 返回結果是一個TarInfo列表
all_file_list = tar_obj.getmembers()
for tmp_file in all_file_list:
print(tmp_file.name)
# 還可以在不解壓的情況下直接讀取檔案的內容
# 可以透過TarInfo.isdir()來區分是檔案還是目錄
# if not tmp_file.isdir():
# # 相當於zip的open,並不會把檔案給解壓出來
# tar_fd = tar_obj.extractfile(tmp_file)
# print(tar_fd.read())
# 函式的功能是將壓縮檔案直接解壓
def my_untar_function(tar_file_name, path=".", model="r"):
with tarfile.open(tar_file_name, model) as tar_obj:
tar_obj.extractall(path=path)
#學習中遇到問題沒人解答?小編建立了一個Python學習交流群:153708845
if __name__ == "__main__":
# 自己在測試時要先自行建立好要壓縮的檔案和目錄
tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
tar_dir_list = ["test_tar_dir"]
tar_file_name = "test_tar.tar"
# 在.tar基礎上,tarfile還支援gz/bz2/xz的壓縮,只要在原來開啟模式的基礎上使用:或|接上壓縮方法即可,如"r:gz"
# 特別的,如果是讀取檔案,可以使用"r:*"來指示嘗試以任意格式讀取
open_model = "w"
# open_model = "w:gz"
my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
open_model = "r"
# open_model = "r:*"
my_traversal_tar_function(tar_file_name, model=open_model)
# open_model = "r:*"
# my_untar_function(tar_file_name, path=".", model=open_model)