提取pdf指定頁

redufa發表於2024-11-21

import fitz  # 匯入 PyMuPDF 庫

def extract_pages(source_filepath, output_filepath, start_page, end_page):
    # 開啟源 PDF 檔案
    doc = fitz.open(source_filepath)
    
    # 建立一個新的 PDF 文件物件,用於儲存提取的頁面
    new_doc = fitz.open()
    
    # 提取指定範圍的頁面
    for page_num in range(start_page - 1, end_page):  # 頁面編號從 0 開始
        new_doc.insert_pdf(doc, from_page=page_num, to_page=page_num)
    
    # 儲存新 PDF 文件到指定的輸出檔案路徑
    new_doc.save(output_filepath)
    new_doc.close()  # 關閉新建立的 PDF 文件,釋放資源

# 指定輸入檔案的路徑
input_file = ".pdf"
# 指定輸出檔案的路徑
output_file = "output.pdf"
# 指定要提取的頁面範圍
start_page = 544  # 開始頁面(例如第2頁)
end_page = 595  # 結束頁面(例如第5頁)

# 呼叫 extract_pages 函式,傳入輸入檔案、輸出檔案和頁面範圍
extract_pages(input_file, output_file, start_page, end_page)

相關文章