python 讀取PDF表格
python讀取PDF表格
1.相關庫函式
利用python讀取pdf中的表格部分,並且以EXCEL的形式儲存到本地,主要利用了兩個庫,pdfplumber和pandas,前者用於操作PDF,後者用於操作EXCEL。
先附上相關程式碼:
import pdfplumber
import pandas as pd
def pdf_read():
pdf = pdfplumber.open("aaaa.pdf")
#pages=input("轉換表格的頁碼")
p0=pdf.pages[37]
table=p0.extract_table()
print(table)
df=pd.DataFrame(table[1:], columns=table[0])
df.to_excel("bbbb.xlsx")
if __name__ == '__main__':
pdf_read()
首先利用pdfplumber.open
載入表格,然後跳轉到表格所在的頁碼。執行extract_table()
後,再將提取出的表格放到pandas的dataframe中,然後利用pandas另存為表格,
2.可能遇到的問題
在生成表格的時候,可能會彈出ImportError: No module named openpyxl,xlrd ,這個時候,只需要pip install openpyxl 就可以了。
相關文章
- Java 讀取PDF中的表格Java
- Python讀取Excel表格PythonExcel
- PHPExcel 讀取表格PHPExcel
- Python如何讀取pdf中的圖片Python
- golang讀取pdfGolang
- 讀取JSON資料存入表格JSON
- RAG學習--pdf讀取與切割
- python讀寫Excel表格程式碼PythonExcel
- Java 建立、填充、讀取PDF表單域Java
- 從json物件中讀取資料存入表格JSON物件
- Java 讀取PDF中的文字和圖片Java
- Java 讀取Word表格中的文字和圖片Java
- Python excel表格讀寫,格式化處理PythonExcel
- C# 提取PDF中的表格C#
- Java 讀取Word文字框中的文字/圖片/表格Java
- python讀取大檔案Python
- python對Excel的讀取PythonExcel
- python小白檔案讀取Python
- python 讀取文字檔案Python
- python列表讀取的方法Python
- python讀取MySQL資料PythonMySql
- 學以致用:Python爬取廖大Python教程製作pdfPython
- Python3 進行讀取、修改和寫Excel表格(.xlsx檔案)的常用功能示例PythonExcel
- poi讀取表格資料和表格顯示不一致問題解決
- Java新增條形碼到PDF表格Java
- 爬取《The Hitchhiker’s Guide to Python!》python進階書並製成pdfGUIIDEPython
- Java PDF書籤——新增、編輯、刪除、讀取書籤Java
- OpenCV-Python 視訊讀取OpenCVPython
- Python讀取YAML配置資料PythonYAML
- python讀取串列埠 資料Python串列埠
- python如何讀取大檔案Python
- dotnet OpenXML 讀取 PPT 內嵌 ole 格式 Excel 表格的資訊XMLExcel
- pdf的表格怎麼轉換成word?
- Python 將PDF轉為PDF/A、PDF/X,以及PDF/A轉回PDFPython
- Python讀取Ansible playbooks返回資訊Python
- Python中CSV讀取和轉換Python
- python讀取json格式的標註PythonJSON
- Python使用Argparse讀取命令引數Python