概述
Python處理PDF檔案需要安裝相應的庫:【PyPDF2】庫
使用場景
工作中可能會涉及處理pdf檔案,PyPDF2就是這樣一個庫, 使用它可以輕鬆的處理 pdf 檔案,它提供了讀、寫、分割、合併、檔案轉換等多種操作。
安裝庫
使用說明
PyPDF2 官方文件(documentation)
學習網站
部落格
# 匯入相關類
from PyPDF2 import PdfFileReader, PdfFileWriter
# 定義輸入檔案和輸出檔案(路徑)
inputFile = `read.pdf`
outputFile = `write.pdf`
# 獲取一個 PdfFileReader 物件
pdfReader = PdfFileReader(open(inputFile, `rb`))
# 獲取 PDF 的頁數
pageCount = pdfReader.getNumPages()
print(pageCount)
# 返回一個 PageObject
page = pdfReader.getPage(i)
# 獲取一個 PdfFileWriter 物件
pdfWriter = PdfFileWriter()
# 將一個 PageObject 加入到 PdfFileWriter 中
pdfWriter.addPage(page)
# 輸出到檔案中
pdfWriter.write(open(outputFile, `wb`))
GitHub
提供了使用案例,當我們使用的時候再具體檢視。