openpyxl 操作 Excel表的格基本用法

roc_guo發表於2021-11-29

本文將介紹如下操作:

  • 如何在記憶體中建立工作簿
  • 如何從工作簿中檢索、建立、複製、移動和刪除工作表
  • 如何從檔案建立工作簿
  • 如何訪問一系列單元格
  • 如何遍歷行和列
安裝openpyxl庫

在 8中有如下兩種方式安裝openpyxl庫:

方法一,使用yum包管理器安裝:

[root@localhost ~]# yum -y install python3-openpyxl

方法二,使用pip 安裝:

[root@localhost ~]# pip3 install openpyxl
在記憶體中建立一個工作表

建立工作簿,我們所要做的就是匯入並使用  Workbook 類。當我們建立 Workbook 類的例項時,預設情況下也會建立一個新的電子表格。我們可以通過  active 屬性訪問它:

[root@localhost ~]# python3
>>> from openpyxl import Workbook
>>> workbook = Workbook()
>>> sheet = workbook.active
>>>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
建立新表格時,它不包含任何單元格。它們是即時建立的,因此最好直接訪問它們以避免浪費記憶體。我們可以像引用字典鍵一樣引用表格的單元格。例如,要獲取 'A1' 單元格的值,我們可以這樣寫:

>>> a1_value = sheet['A1'].value
>>> print(a1_value)
None

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
使用print()列印A1單元格的值,因為沒有資料,所以返回值為 None

如果要為一個單元格賦值,我們可以這樣寫:

>>> sheet['A1'] = "Hello Excel!"

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法

然後重新給 a1_value賦值,然後列印,可以看到 A1單元格的內容了。

訪問單元格的另一種方法是使用  Worksheet 物件的  cell() 方法,並將行/列座標作為引數傳遞:

>>> a1_value = sheet.cell(row = 1, column = 1).value
>>> print(a1_value)
Hello Excel!

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
使用 cell()填充內容:

>>> sheet.cell(row = 2, column = 1, value = 'Hello Python!')
<cell 'Sheet'.A2>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
儲存我們建立的工作表,我們要做的就是使用 Workbook 物件的  save() 方法,並將目標檔案的名稱作為引數傳遞。例如,要將工作表儲存為 worksheet.xlsx,我們將執行:

>>> workbook.save('worksheet.xlsx')

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
一旦我們呼叫此方法,就會在我們的系統上建立一個具有指定名稱的檔案。

在工作簿中新建工作表

在前面的示例中,我們看到了如何訪問工作簿的活動電子表格。然而,一個工作簿可以包含多個工作表,那麼如果我們想建立一個新的工作表怎麼辦?我們可以通過 Workbook 的 create_sheet 方法來實現:

>>> sheet2 = workbook.create_sheet('Sheet2')
>>> sheet2 = workbook['Sheet2']
>>> print(workbook.sheetnames)
['Sheet', 'Sheet2']

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
通過使用workbook的 sheetnames方法來檢視工作簿中的所有工作表。

create_sheet 方法接受兩個可選引數: title 和  index。我們可以使用 title來為新工作表分配一個名稱,而後者 index來指定應該在什麼位置插入工作表。在上面的示例中,我們使用“Sheet2”作為標題建立了一個新工作表。

複製和移動工作表

將預設啟用的工作表複製成副本,我們可以使用  copy_worksheet 方法,將應複製的工作表作為引數傳遞。例如,要複製活動工作表:

>>> print(workbook.active)
<worksheet "Sheet">
>>> sheet_copy = workbook.copy_worksheet(workbook.active)

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
下面再將Sheet2工作表複製一個副本:

>>> sheet_copy = workbook.copy_worksheet(sheet2)
>>> workbook.save('/data/worksheet.xlsx')

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
要將現有工作表移動到工作簿中的確定位置,我們可以使用 move_sheet 方法,該方法接受兩個引數。第一個 sheet 是必需的,是我們想要移動的工作表,第二個是可選的(預設為 0),是用於指定工作表位置的偏移量。讓我們看一個例子。在這種情況下,預設工作表“Sheet”是工作簿中的第一個。要將其移動到第二個位置,我們可以這樣寫:

>>> workbook.move_sheet(workbook["Sheet"], 1)
>>> print(workbook.sheetnames)
['Sheet2', 'Sheet', 'Sheet Copy', 'Sheet2 Copy']

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
可以使用 print(workbook.sheetnames)來檢視工作表的順序。

刪除工作表

要從工作簿中刪除工作表,我們使用 Workbook 類的  remove() 方法。該方法接受一個強制引數,即表示我們要刪除的工作表的物件。假設我們想從我們的工作簿中刪除“Sheet2 Copy”工作表,我們會寫:

>>> workbook.remove(workbook['Sheet2 Copy'])
>>> print(workbook.sheetnames)
['Sheet2', 'Sheet', 'Sheet Copy']
>>> workbook.save('/data/worksheet.xlsx')
>>>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法

從檔案載入工作簿

使用 openpyxl 讀取現有的 excel 表格檔案非常簡單。我們所要做的就是從庫中載入  load_workbook 函式。這個函式唯一的強制引數是filename,必須是我們要開啟的檔案的路徑。假設這個檔案叫做 workbook.xlsx

>>> from openpyxl import load_workbook
>>> 
>>> workbook = load_workbook('workbook.xlsx')
>>>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法

訪問多個單元格

如果我們想獲取一系列單元格的值而不是單個單元格的值怎麼辦?我們所要做的就是使用以下語法指定範圍:

>>> cell_values = sheet['A1:D1']

指定範圍的結果將是一個元組,其中包含指定的每一行的元組。在上面的例子中,只有一行,因為我們指定了從 A1 到 D1 的單元格(它們確實在同一行),所以結果是:

>>> print(cell_values)
((<cell 'Sheet'.A1>, <cell 'Sheet'.B1>, <cell 'Sheet'.C1>, <cell 'Sheet'.D1>),)

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
如果想要獲取多行多列的單元格,我們可以這樣寫:

>>> cell_values = sheet['A1':'D5']
>>> print(cell_values)
((<cell 'Sheet'.A1>, <cell 'Sheet'.B1>, <cell 'Sheet'.C1>, <cell 'Sheet'.D1>), (<cell 'Sheet'.A2>, <cell 'Sheet'.B2>, <cell 'Sheet'.C2>, <cell 'Sheet'.D2>), (<cell 'Sheet'.A3>, <cell 'Sheet'.B3>, <cell 'Sheet'.C3>, <cell 'Sheet'.D3>), (<cell 'Sheet'.A4>, <cell 'Sheet'.B4>, <cell 'Sheet'.C4>, <cell 'Sheet'.D4>), (<cell 'Sheet'.A5>, <cell 'Sheet'.B5>, <cell 'Sheet'.C5>, <cell 'Sheet'.D5>))

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
如果想顯示指定列的所有資料可以這樣寫:

>>> cells = sheet['A']
>>> print(cells)
(<cell 'Sheet'.A1>, <cell 'Sheet'.A2>, <cell 'Sheet'.A3>, <cell 'Sheet'.A4>, <cell 'Sheet'.A5>)
>>> 
>>> cells = sheet['A':'D']
>>> print(cells)
((<cell 'Sheet'.A1>, <cell 'Sheet'.A2>, <cell 'Sheet'.A3>, <cell 'Sheet'.A4>, <cell 'Sheet'.A5>), (<cell 'Sheet'.B1>, <cell 'Sheet'.B2>, <cell 'Sheet'.B3>, <cell 'Sheet'.B4>, <cell 'Sheet'.B5>), (<cell 'Sheet'.C1>, <cell 'Sheet'.C2>, <cell 'Sheet'.C3>, <cell 'Sheet'.C4>, <cell 'Sheet'.C5>), (<cell 'Sheet'.D1>, <cell 'Sheet'.D2>, <cell 'Sheet'.D3>, <cell 'Sheet'.D4>, <cell 'Sheet'.D5>))

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
同樣,我們可以通過指定數字範圍來訪問整行。要獲取前三行的所有單元格,可以這樣寫:

>>> cells = sheet[1:3]
>>> print(cells)
((<cell 'Sheet'.A1>, <cell 'Sheet'.B1>, <cell 'Sheet'.C1>, <cell 'Sheet'.D1>), (<cell 'Sheet'.A2>, <cell 'Sheet'.B2>, <cell 'Sheet'.C2>, <cell 'Sheet'.D2>), (<cell 'Sheet'.A3>, <cell 'Sheet'.B3>, <cell 'Sheet'.C3>, <cell 'Sheet'.D3>))
使用 iter_rows() 和 iter_cols() 方法迭代行和列

我們可以使用表格的 iter_rows() 和 iter_cols() 方法,而不是指定範圍來訪問一系列單元格的值。兩種方法都接受相同的可選引數:

  • min_row 最小行的索引
  • max_row 最大行的索引
  • min_col 最小列索引
  • max_col 最大列索引
  • values_only 是否只返回單元格值

在帶有 min_row/max_row 和 min_col/max_col 引數的這兩種方法中,我們指定了應該進行迭代的行和列的範圍。兩者的區別在於 iter_rows() 返回按行組織的單元格,其中 iter_cols() 返回按列組織的單元格。讓我們看一些實際的例子。假設我們要遍歷從第一列到第五列的前三行,並希望獲得按行組織的單元格。這是我們將執行的內容:

>>> for i in sheet.iter_rows(min_row=1, max_row=3, min_col=1, max_col=5):
...   for cell in i:
...      print(cell)
... 
<cell 'Sheet'.A1>
<cell 'Sheet'.B1>
<cell 'Sheet'.C1>
<cell 'Sheet'.D1>
<cell 'Sheet'.E1>
<cell 'Sheet'.A2>
<cell 'Sheet'.B2>
<cell 'Sheet'.C2>
<cell 'Sheet'.D2>
<cell 'Sheet'.E2>
<cell 'Sheet'.A3>
<cell 'Sheet'.B3>
<cell 'Sheet'.C3>
<cell 'Sheet'.D3>
<cell 'Sheet'.E3>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法
為了獲得相同的單元格,這次按列迴圈,我們將使用相同的引數傳遞給 iter_cols() 方法:

>>> for i in sheet.iter_cols(min_row=1, max_row=3, min_col=1, max_col=5):
...   for cell in i:
...     print(cell)
... 
<cell 'Sheet'.A1>
<cell 'Sheet'.A2>
<cell 'Sheet'.A3>
<cell 'Sheet'.B1>
<cell 'Sheet'.B2>
<cell 'Sheet'.B3>
<cell 'Sheet'.C1>
<cell 'Sheet'.C2>
<cell 'Sheet'.C3>
<cell 'Sheet'.D1>
<cell 'Sheet'.D2>
<cell 'Sheet'.D3>
<cell 'Sheet'.E1>
<cell 'Sheet'.E2>
<cell 'Sheet'.E3>

openpyxl 操作 Excel表的格基本用法openpyxl 操作 Excel表的格基本用法

總結

在本教程中,我們學習瞭如何使用 Python openpyxl 庫處理 Excel 表格檔案。我們看到了如何在記憶體中或從檔案中建立工作簿,如何檢索、建立、複製、移動和刪除工作表,如何訪問單元格和單元格範圍,以及如何遍歷行和列。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69901823/viewspace-2844528/,如需轉載,請註明出處,否則將追究法律責任。

相關文章