Python應用【PDF處理-pypdf2】

既生喻何生亮發表於2018-12-02

概述

Python處理PDF檔案需要安裝相應的庫:【PyPDF2】庫

使用場景
工作中可能會涉及處理pdf檔案,PyPDF2就是這樣一個庫, 使用它可以輕鬆的處理 pdf 檔案,它提供了讀、寫、分割、合併、檔案轉換等多種操作。

安裝庫

網站

使用說明

PyPDF2 官方文件(documentation)

學習網站

部落格

# 匯入相關類
from PyPDF2 import PdfFileReader, PdfFileWriter
 
# 定義輸入檔案和輸出檔案(路徑)
inputFile = `read.pdf`
outputFile = `write.pdf`

# 獲取一個 PdfFileReader 物件 
pdfReader = PdfFileReader(open(inputFile, `rb`)) 

# 獲取 PDF 的頁數 
pageCount = pdfReader.getNumPages() 
print(pageCount) 

# 返回一個 PageObject 
page = pdfReader.getPage(i) 

# 獲取一個 PdfFileWriter 物件 
pdfWriter = PdfFileWriter() 

# 將一個 PageObject 加入到 PdfFileWriter 中 
pdfWriter.addPage(page) 

# 輸出到檔案中 
pdfWriter.write(open(outputFile, `wb`))

GitHub

提供了使用案例,當我們使用的時候再具體檢視。

相關文章