提取pdf指定頁

redufa發表於2024-11-21

原文網址 : https://www.cnblogs.com/redufa/p/18560475


import fitz  # 匯入 PyMuPDF 庫

def extract_pages(source_filepath, output_filepath, start_page, end_page):
    # 開啟源 PDF 檔案
    doc = fitz.open(source_filepath)
    
    # 建立一個新的 PDF 文件物件，用於儲存提取的頁面
    new_doc = fitz.open()
    
    # 提取指定範圍的頁面
    for page_num in range(start_page - 1, end_page):  # 頁面編號從 0 開始
        new_doc.insert_pdf(doc, from_page=page_num, to_page=page_num)
    
    # 儲存新 PDF 文件到指定的輸出檔案路徑
    new_doc.save(output_filepath)
    new_doc.close()  # 關閉新建立的 PDF 文件，釋放資源

# 指定輸入檔案的路徑
input_file = ".pdf"
# 指定輸出檔案的路徑
output_file = "output.pdf"
# 指定要提取的頁面範圍
start_page = 544  # 開始頁面（例如第2頁）
end_page = 595  # 結束頁面（例如第5頁）

# 呼叫 extract_pages 函式，傳入輸入檔案、輸出檔案和頁面範圍
extract_pages(input_file, output_file, start_page, end_page)

python的應用 | 提取指定資料夾下所有PDF檔案的頁數
2024-03-27
Python
Python中用PyPDF2拆分pdf提取頁面
2021-09-11
Python
Python提取文字指定內容
2024-03-26
Python
高效的PDF文字提取技術
2023-11-30
Python 提取PDF文字和圖片
2023-10-10
Python
提取pdf文件的目錄1.0
2024-11-03
C# 提取PDF中的表格
2021-10-19
C#
C#簡單的web網頁html抓取並提取指定a標籤連結
2019-05-11
C#Web網頁HTML
提取pdf目錄，並且分級
2024-11-03
PDF的資訊提取的問題
2022-01-05
python 網頁文字提取
2018-07-25
Python網頁
如何用Python批量提取PDF文字內容？
2018-06-27
Python
正規表示式提取指定字元之間字串
2018-08-05
字元字串
如何提取網頁上的顏色，網頁顏色程式碼提取工具ColorWell
2021-01-05
網頁
使用 Python 旋轉PDF頁面、或調整PDF頁面順序
2024-05-13
Python
Java 在PDF中插入頁首、頁尾
2024-03-25
Java
wkhtmltopdf 生成帶頁首頁尾的pdf
2024-08-04
HTML
提取動態html網頁內容
2018-09-06
HTML網頁
網頁提取資料常用正則
2018-09-05
網頁
如何用Python從PDF檔案中提取文字詞彙
2018-12-18
Python
巧用Python的camelot庫批量提取PDF發票資訊
2021-09-23
Python
jQuery列印網頁指定區域
2018-07-14
jQuery網頁
如何將一個pdf拆分為多個單頁pdf？
2024-05-28
C# iText 7 切分PDF，處理PDF頁面大小
2022-04-26
C#
kkFileView預覽檔案指定預覽方式為pdf
2024-06-22
View
批量抓取網頁pdf檔案
2019-02-16
網頁
html頁面轉PDF的功能
2019-04-04
HTML
實踐指南-網頁生成PDF
2021-06-03
網頁
網頁特效,網頁模板,pdf下載 - IT書包
2019-05-11
網頁特效
win10系統如何提取網頁中影片_win10提取網頁中影片的圖文教程
2020-03-16
Win10網頁
Python 查詢PDF中的指定文字並高亮顯示
2024-03-18
Python
pdf在前端網頁的顯示
2024-04-11
前端網頁
Python 調整PDF頁面尺寸大小
2024-06-11
Python
Python | 實現pdf檔案分頁
2021-10-31
Python
Python lxml ：從網頁HTML/XML提取資料
2019-07-04
PythonXML網頁HTML
nginx 設定 404 500 頁面跳轉到指定頁面
2018-03-23
Nginx
分頁方法,始終只生成指定數量的頁碼
2021-01-27
win10系統如何提取網頁中視訊_win10提取網頁中視訊的圖文教程
2020-03-16
Win10網頁

提取pdf指定頁

相關文章