Python程式設計從0到1(實戰篇:提取Word表格儲存到Excel)
今天突然有一個需求,要把統計局網站下載的Word文件裡的表格提取出來,放到Excel表中,便於下一步進行資料分析。
1. 引入擴充套件庫
# -*- coding: utf-8 -*-
import docx
from docx import Document
import xlwt;
import xlrd;
import glob
2. 讀取Word文件中的表格
def readdoc(filename):
doc = docx.Document(filename)
tables = []
for table in doc.tables:
table_temp = []
for row in table.rows:
row_temp = []
for cell in row.cells:
row_temp.append(cell.text)
table_temp.append(row_temp)
tables.append(table_temp)
return tables
3. 寫入Excel檔案
def writeExcel(tables,filename):
Sheet_index = 0
workbook = xlwt.Workbook(encoding='utf-8')
for table in tables:
worksheet = workbook.add_sheet('sheet' + str(Sheet_index),cell_overwrite_ok = True)
Sheet_index = Sheet_index + 1
for rows in table:
r = table.index(rows)
for cell in rows:
c = rows.index(cell)
print(r,c,cell)
worksheet.write(r,c,cell)
workbook.save(filename[:-5] + ".xls")
4. 遍歷目錄下所有docx檔案,並生成同名Excel檔案
filenames = glob.glob("jtdoc/*.docx")
for filename in filenames:
tables = readdoc(filename)
writeExcel(tables,filename)
相關文章
- 滴滴從KV儲存到NewSQL實戰SQL
- node專案從0到1實戰
- Python專案實戰(一)《Python程式設計 從入門到實踐》Python程式設計
- 《Python程式設計:從入門到實踐》Python程式設計
- word放不下excel表格怎麼辦 word放不下excel表格的方法Excel
- Python多執行緒程式設計深度探索:從入門到實戰Python執行緒程式設計
- 訂單系統:從0到1設計思路
- Python 程式設計從入門到實踐5Python程式設計
- 【Python程式設計從入門到實踐】 1 Linux搭建Python編譯環境Python程式設計Linux編譯
- 從0到1實現PromisePromise
- <<從0到1學C++>> 第2篇 認識C++程式導向程式設計的特點C++程式設計
- 從0到1:React專案中的Webpack配置實戰ReactWeb
- 程式設計師如何從0到1搭建自己的技術部落格程式設計師
- [轉]從0到1教你設計業務系統
- Python從0到1的學習之道Python
- excel表格怎麼轉換成word文件 表格資料轉換到文件Excel
- 從0到1完成nutch分散式爬蟲專案實戰分散式爬蟲
- 從0到1使用Kubernetes系列(六):資料持久化實戰持久化
- python讀寫Excel表格程式碼PythonExcel
- 從0到1優雅的實現PHP多程式管理PHP
- PHash從0到1
- 從0到1實現一個簡單計算器
- 從0開始的數值設計實戰(一)
- 一篇文章帶你使用 Python 將 txt 文件內容儲存到 excel 表中PythonExcel
- 如何將excel表格匯入word並保持格式不變 如何把excel的表格弄到word文件Excel
- 從0到1實現VueUI庫思路VueUI
- DevOPS實戰:從0到1搭建基於Docker的Gitlab CI/CDdevDockerGitlab
- Flutter入門實戰:從0到1仿寫web版掘金AppFlutterWebAPP
- Python程式設計:從入門到實踐(第2版)第1章習題答案Python程式設計
- 如何將Word文件轉成Excel表格?Excel
- 用python庫openpyxl操作excel,從源excel表中提取資訊複製到目標excel表中PythonExcel
- 如何從 0 到 1 設計、構建移動分析架構架構
- 如何從0到1設計一個類Dubbo的RPC框架RPC框架
- excel表格文字識別-ocr表格文字提取api介面整合ExcelAPI
- Python 指令碼高階程式設計:從基礎到實踐Python指令碼程式設計
- 如何設定excel表格貼上到word後寬度不變Excel
- python儲存超大資料excel表格——大於65532Python大資料Excel
- 【React 實戰教程】從0到1 構建 github star管理工具ReactGithub