python 讀取PDF表格
python讀取PDF表格
1.相關庫函式
利用python讀取pdf中的表格部分,並且以EXCEL的形式儲存到本地,主要利用了兩個庫,pdfplumber和pandas,前者用於操作PDF,後者用於操作EXCEL。
先附上相關程式碼:
import pdfplumber
import pandas as pd
def pdf_read():
pdf = pdfplumber.open("aaaa.pdf")
#pages=input("轉換表格的頁碼")
p0=pdf.pages[37]
table=p0.extract_table()
print(table)
df=pd.DataFrame(table[1:], columns=table[0])
df.to_excel("bbbb.xlsx")
if __name__ == '__main__':
pdf_read()
首先利用pdfplumber.open
載入表格,然後跳轉到表格所在的頁碼。執行extract_table()
後,再將提取出的表格放到pandas的dataframe中,然後利用pandas另存為表格,
2.可能遇到的問題
在生成表格的時候,可能會彈出ImportError: No module named openpyxl,xlrd ,這個時候,只需要pip install openpyxl 就可以了。
相關文章
- Java 讀取PDF中的表格Java
- Python讀取Excel表格PythonExcel
- python Pandas 讀取txt表格Python
- PHPExcel 讀取表格PHPExcel
- golang讀取pdfGolang
- Python如何讀取pdf中的圖片Python
- 讀取JSON資料存入表格JSON
- RAG學習--pdf讀取與切割
- Java 建立、填充、讀取PDF表單域Java
- python讀寫Excel表格程式碼PythonExcel
- Java 讀取PDF中的文字和圖片Java
- Java 讀取Word表格中的文字和圖片Java
- 從json物件中讀取資料存入表格JSON物件
- 用R讀取PDF並進行資料探勘
- C# 提取PDF中的表格C#
- python讀取檔案——python讀取和儲存mat檔案Python
- Java 讀取Word文字框中的文字/圖片/表格Java
- Java新增條形碼到PDF表格Java
- Python excel表格讀寫,格式化處理PythonExcel
- poi讀取表格資料和表格顯示不一致問題解決
- Java PDF書籤——新增、編輯、刪除、讀取書籤Java
- Python3 進行讀取、修改和寫Excel表格(.xlsx檔案)的常用功能示例PythonExcel
- python對Excel的讀取PythonExcel
- python列表讀取的方法Python
- python讀取MySQL資料PythonMySql
- python小白檔案讀取Python
- python讀取大檔案Python
- python 讀取csv檔案Python
- 【python】建立,讀取檔案Python
- python 讀取文字檔案Python
- [python]使用xlrd對Excel表格進行讀寫操作PythonExcel
- 學以致用:Python爬取廖大Python教程製作pdfPython
- pdf的表格怎麼轉換成word?
- Python 將PDF轉為PDF/A、PDF/X,以及PDF/A轉回PDFPython
- dotnet OpenXML 讀取 PPT 內嵌 ole 格式 Excel 表格的資訊XMLExcel
- jquery使用ajax讀取後臺資料在表格中顯示jQuery
- 讀取載密Excel表格中壓縮原始檔資料區Excel
- js獲取表格方法JS