Python 玩轉 Excel
在前面抓取高考分數線的文章中,我們用到了 openpyxl
模組來儲存資料到 Excel,今天帶大家學習一下該模組的詳細使用。
根據官方文件,openpyxl 是一個用來處理 xlsx/xlsm/xltx/xltm 格式 Excel 檔案的 Python 程式碼庫,同時支援 Pandas 和 NumPy 等包,能夠繪製圖表,並且同樣支援格式控制等。
openpyxl 用起來非常簡單,對照文件就可以解決一些基本需求,比如常見的讀寫操作。
現在還有很多人在用 Excel 2003 版本,即 xls 格式,那麼
xls
和xlsx
有什麼區別呢?xls 是一個特有的二進位制格式,其核心結構是複合文件型別的結構,而 xlsx 的核心結構是 XML 型別的結構,採用的是基於 XML 的壓縮方式,使其佔用的空間更小。xlsx 中最後一個 x 的意義就在於此。
1 基本概念
在 openpyxl 中,主要用到三個概念:Workbook,Sheet,Cell:
Workbook
:就是一個 excel 工作簿,其中包含多個 sheet;Sheet
:工作簿中的一張表頁;Cell
:就是簡單的一個單元格,用來儲存資料物件;
openpyxl 的主要操作就是圍繞著這三個概念進行的,無怪乎:開啟 Workbook,定位 Sheet,操作 Cell。下面就分別介紹 openpyxl 幾個常見的方法。
2 安裝
openpyxl 的安裝很簡單,使用 pip 直接安裝即可。
pip install openpyxl
3 基本操作
提前新建一個測試 Excel:
匯入模組
>>> import openpyxl
3.1 Workbook 相關
讀取已存在的 xlsx
>>> wb = openpyxl.load_workbook("test.xlsx")
openpyxl.load_workbook() 函式接受檔名,返回一個 Workbook 資料型別的值。這個 Workbook 物件代表這個 Excel 檔案,有點類似 File 物件代表一個開啟的文字檔案。
以只讀模式讀取
>>> wb = openpyxl.load_workbook("test.xlsx", read_only=True)
儲存 Workbook
在對 Workbook 進行了相關操作後,可以呼叫 save(filename)
方法進行儲存。
另外,在只讀模式下儲存時,會報 Workbook is read-only
異常。
>>> wb.save('test.xlsx')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/usr/local/lib/python3.5/dist-packages/openpyxl/workbook/workbook.py", line 363, in save
raise TypeError("""Workbook is read-only""")
TypeError: Workbook is read-only
3.2 Sheet 相關
獲取 Workbook 中的 sheet 列表
返回一個 sheet 的 list。
>>> sheet = wb.worksheets
獲取 sheet 頁的名稱列表
>>> wb.sheetnames
['各專業歷年錄取分數線', '測試頁']
讀取 sheet 頁
# 根據名稱讀取
>>> sheet = wb['測試頁']
# 透過索引 index 讀取
>>> sheet = wb.worksheets[1]
獲取當前正在使用的 sheet 頁
>>> sheet = wb.active
sheet 頁屬性
>>> sheet.title
'測試頁'
# 最大列數
>>> sheet.max_column
4
# 最大行數
>>> sheet.max_row
13
新建 sheet 頁
>>> wb.create_sheet('test2')
<Worksheet "test2">
>>> wb.sheetnames
['各專業歷年錄取分數線', '測試頁', 'test2']
# 在指定索引處新建
>>> sheet = wb.create_sheet('test2',1)
>>> wb.sheetnames
['各專業歷年錄取分數線', 'test21', 'test2', '測試頁']
若 sheet 頁重名,會自動進行重新命名。
修改 sheet 頁名稱
>>> sheet = wb['test2']
>>> sheet.title = 'test3'
>>> wb.sheetnames
['各專業歷年錄取分數線', '測試頁', 'test3']
刪除 sheet 頁
要先獲取到 sheet 頁才能刪除,不能直接用 sheet 頁的名稱刪除
>>> sheet = wb['test3']
>>> wb.remove(sheet)
>>> wb.sheetnames
['各專業歷年錄取分數線', '測試頁']
# 也可以使用 del 進行刪除
>>> del wb['test2']
3.3 行和列
獲取指定行/列
# 獲取第 1 行
>>> sheet[1]
(<Cell '測試頁'.A1>, <Cell '測試頁'.B1>, <Cell '測試頁'.C1>, <Cell '測試頁'.D1>)
# 獲取第 1 列
>>> sheet['A']
(<Cell '測試頁'.A1>, <Cell '測試頁'.A2>, <Cell '測試頁'.A3>, <Cell '測試頁'.A4>, <Cel
l '測試頁'.A5>, <Cell '測試頁'.A6>, <Cell '測試頁'.A7>, <Cell '測試頁'.A8>, <Cell '測
試頁'.A9>, <Cell '測試頁'.A10>, <Cell '測試頁'.A11>, <Cell '測試頁'.A12>, <Cell '測試
頁'.A13>)
對行/列切片獲取
>>> sheet[2:3]
((<Cell '測試頁'.A2>, <Cell '測試頁'.B2>, <Cell '測試頁'.C2>, <Cell '測試頁'.D2>), (<
Cell '測試頁'.A3>, <Cell '測試頁'.B3>, <Cell '測試頁'.C3>, <Cell '測試頁'.D3>))
>>> sheet['A:B']
((<Cell '測試頁'.A1>, <Cell '測試頁'.A2>, <Cell '測試頁'.A3>, <Cell '測試頁'.A4>, <Ce
ll '測試頁'.A5>, <Cell '測試頁'.A6>, <Cell '測試頁'.A7>, <Cell '測試頁'.A8>, <Cell '
測試頁'.A9>, <Cell '測試頁'.A10>, <Cell '測試頁'.A11>, <Cell '測試頁'.A12>, <Cell '測
試頁'.A13>), (<Cell '測試頁'.B1>, <Cell '測試頁'.B2>, <Cell '測試頁'.B3>, <Cell '測試
頁'.B4>, <Cell '測試頁'.B5>, <Cell '測試頁'.B6>, <Cell '測試頁'.B7>, <Cell '測試頁'.B
8>, <Cell '測試頁'.B9>, <Cell '測試頁'.B10>, <Cell '測試頁'.B11>, <Cell '測試頁'.B12>
, <Cell '測試頁'.B13>))
獲取所有行/列
返回的是一個 Generator 物件,它包含該區域中的 Cell 物件。裡面是每一行(列)的資料,每一行(列)又由一個 tuple 包裹。
>>> rows = sheet.rows
>>> rows
<generator object Worksheet._cells_by_row at 0x7f778a7978e0>
>>> columns = sheet.columns
>>> for row in sheet.rows:
... for cell in row:
... print(cell.value)
因為 sheet.rows 是生成器型別,不能直接使用索引,需要先轉換成 list 之後才行,如 list(sheet.rows)2 這樣就獲取到第三行的 tuple 物件。
新增一行值
>>> sheet.append(row)
>>> row = [1,2,3,4,5,6]
3.4 Cell 相關
讀取 Cell
>>> cell = sheet['B2']
>>> cell = sheet.cell(2,1)
需要注意的是:openpyxl 中 row 和 column 為了和 Excel 中的表達方式一致,並不和程式語言的習慣以 0 表示第一個值,而是 1 開始。
Cell 屬性
# 所在列
>>> cell.column
'A'
# 所在行
>>> cell.row
2
# 所屬座標
>>> cell.coordinate
'A2'
# 對應的值
>>> cell.value
'A2'
寫入 Cell
# 直接給單元格賦值
>>> cell.value = 'test'
# 這裡可以不寫 value?
>>> sheet['A1'] = 'kk'
>>> sheet.cell(1,1).value = 'ff'
寫入公式
# 寫入和值
>>> sheet['A14'] = "=SUM(B14:D14)"
>>> sheet['A14'].value
'=SUM(B14:D14)'
# 寫入平均值
>>> sheet['A14'] = "=AVERAGE(B14:D14)"
>>> sheet['A14'].value
'=AVERAGE(B14:D14)'
這裡可發現,在讀取的時候,返回的是公式本身
'=AVERAGE(B14:D14)'
,而不是計算結果。若要返回計算結果,只有手動開啟 test.xlsx 檔案,然後點選儲存更改。
單元格合併與拆分
>>> sheet.merge_cells('A1:A3')
>>> sheet.merge_cells('B1:D2')
如果這些要合併的單元格都有資料,只會保留左上角的資料,其他則丟棄。
分解類似:
>>> sheet.unmerge_cells('A1:A3')
>>> sheet.unmerge_cells('B1:D2')
單元格樣式
from openpyxl.styles import Font, colors, Alignment
# 設定字型: 等線 24 號加粗斜體,字型顏色紅色
bold_itatic_24_font = Font(name="等線", size=24, italic=True, color=colors.RED, bold=True)
sheet["B1"].font = bold_itatic_24_font
# 對齊方式: B1 中的資料垂直居中和水平居中
sheet["C1"].alignment = Alignment(horizontal="center", vertical="center")
# 設定行高和列寬
sheet.row_dimensions[2].height = 40
sheet.column_dimensions["C"].width = 30
設定後的效果:
openpyxl 模組的使用就到這裡,完整使用示例可以參考我的上篇:Python 助你填寫高考志願。
其實還有很多高階用法,但個人覺得用的較少,有興趣的可以參考官網:
原文連結:https://mp.weixin.qq.com/s/p6YHL8iL5LZYsiIKvMWh4w
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31559358/viewspace-2218226/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 像ChatGPT玩轉Excel資料ChatGPTExcel
- python pdf轉ExcelPythonExcel
- Excel技巧提升:輕鬆玩轉格式Excel
- Excel技巧提升:輕鬆玩轉神奇公式Excel公式
- 玩轉資料庫,用EXCEL就夠了資料庫Excel
- 玩轉京東支付(python)Python
- Excel轉Json升級版-PythonExcelJSONPython
- python中將xmind轉成excelPythonExcel
- 玩轉python字典與列表(上)Python
- 玩轉python字典與列表(中)Python
- 玩轉python字典與列表(下)Python
- 用《Excel》玩轉格式,輕鬆分析龐大資料!Excel大資料
- python xmind轉Excel(puppet洛洛原創)PythonExcel
- 用 Python 玩轉 GitHub 的貢獻板PythonGithub
- Python玩轉PDF各種騷操作大全!Python
- 實戰|教你用Python玩轉MysqlPythonMySql
- Excel轉PDF怎麼轉?Excel轉PDF方法有哪些Excel
- 股市盛宴,看這個Excel外掛如何玩轉行情資料分析Excel
- python玩轉街機遊戲,操作親民!Python遊戲
- 「玩轉Python」打造十萬博文爬蟲篇Python爬蟲
- Python 實現Excel XLS和XLSX格式相互轉換PythonExcel
- JSON轉ExcelJSONExcel
- excel in pythonExcelPython
- Python 超簡單玩轉微信自動回覆Python
- 使用python玩轉二維碼!速學速用!⛵Python
- 利用wps的com口用python實現excel轉pdfPythonExcel
- 一起玩轉玩轉LiteOS元件:TinyFrame元件
- excel列轉行怎麼做 excel如何轉置行列Excel
- html轉Excel表格HTMLExcel
- excel轉json操作ExcelJSON
- 玩轉macMac
- 玩轉「Canvas」Canvas
- 玩轉EsLintEsLint
- 玩轉 ByteBuffer
- 玩轉 pyocd
- 玩轉redisRedis
- 玩轉TCPTCP
- python操作excelPythonExcel