Python-使用openpyxl讀取excel內容

郭同学的IC修炼笔记發表於2024-03-12

原文網址 : https://www.cnblogs.com/xiaoguoic/p/18069103

1. 本篇文章目標

將下面的excel中的暫存器表單讀入並構建一個字典

2. openpyxl的各種基本使用方法

2.1 開啟工作簿

wb = openpyxl.load_workbook('test_workbook.xlsx')

2.2 獲取工作簿中工作表名字並得到工作表

ws = wb[wb.sheetnames[0]]

wb.sheetnames 會返回一個列表，列表中是每個工作表的名稱，資料型別為str。執行上述程式碼後ws就是獲取的工作表。

2.3 讀取某個單元格的值

d = ws.cell(row=1, column=1).value
print(d)

使用sheet.cell會返回cell物件，再使用cell.value才能返回單元格的值，執行上述程式碼的結果如下：

2.4 按行讀取

按行讀取可以用iter_rows()方法。

for row in ws.iter_rows():
    print(row)

執行上述程式碼的輸出如下：

由圖可知，該方法應當是一個迭代器，返回的是row是一個tuple，裡邊是各個單元格cell。可以按照如下方法獲取每列的值。

import pprint as pp
excel_list = []
for row in ws.iter_rows():
    row = list(row)
    for i in range(len(row)):
        row[i] = row[i].value
    excel_list.append(row)

pp.pprint(excel_list)

這裡用到了一個模組pprint，用來使列印出的列表、字典等美觀易讀。print結果如下：

可以看到已經將excel中的內容構建了一個列表，但是下邊一些沒有內容的行也讀了進來，儘管每個單元的值是None，這是因為之前對下邊的行做過編輯，然後又刪掉，導致這些無內容的單元具有單元格格式，openpyxl會將這些單元格也識別進來，所以要想避免這種情況，使用xlrd庫是一種辦法，或者採用下面的辦法：

excel_list = []
for row in ws.iter_rows():
    row = list(row)
    if row[3].value != None:
        for i in range(len(row)):
            row[i] = row[i].value
        excel_list.append(row)

pp.pprint(excel_list)

執行結果如下，可以看到全為None的行被過濾掉了。

按列讀取方法類似，使用iter_cols()。

2.5切片讀取

有時候我們並不想讀取表格裡的全部內容，只想讀取一部分，這時候可以用iter_rows()和iter_cols()的切片功能。

excel_list = []
for row in ws.iter_rows(min_row=2, min_col=2, max_row=3, max_col=3):
    row = list(row)
    if row[1].value != None:
        for i in range(len(row)):
            row[i] = row[i].value
        excel_list.append(row)

pp.pprint(excel_list)

執行結果如下，可以看到只獲取了表格二行二列至三行三列的內容。

2.6 利用表格行列座標直接獲取單元格、單元格的值、切片

除了上述使用sheet.cell(row, col)來獲取單元格值，以及iter_rows/cols獲取行、列、切片外，還可以直接用excel的行列座標表示來獲取上述內容。

pp.pprint(ws['B3'])  #獲取B3單元格的cell物件
pp.pprint(ws['B3'].value) #獲取B3單元格cell物件的值
pp.pprint(ws['A1':'B2']) # 獲取A1:B2這個切片的cell們
pp.pprint(ws['A:B']) # 獲取A列到B列的所有cell物件
pp.pprint(ws[1:2]) # 獲取行1到行2兩行的所有cell物件

這裡要注意使用這種切片、獲取行列物件值的時候不能直接用.value方法，.value只是單獨cell即一個單元格的cell時才能直接用，所以要想用這種方法獲取切片、行列的值時要配合遍歷、列表等方法構建。

2.7快速獲得工作表的行們和列們

使用sheet.rows 和sheet.cols。

pp.pprint(list(ws.rows))

執行結果如下：

3.構建本任務所需字典

程式碼如下：

class ReadRegListExcel:
    def __init__(self, this_ws):
        self.reg_dic = {}
        self.ws = this_ws

    def excel_max_rows(self):
        max_rows = 0
        for row in ws.rows:
            if row[3].value != None:
                max_rows += 1
        return max_rows

    def construct_dic(self):
        max_rows = self.excel_max_rows()
        self.reg_dic['module name'] = self.ws.cell(row=1, column=2).value
        self.reg_dic['module base address'] = self.ws.cell(row=1, column=4).value
        self.reg_dic['registers'] = []
        row = 3
        all_rows = list(self.ws.rows)
        print(all_rows)
        while row <= max_rows:
            if all_rows[row-1][0].value != None:
                self.reg_dic['registers'].append({})
                self.reg_dic['registers'][-1]['register name'] = all_rows[row-1][0].value
                self.reg_dic['registers'][-1]['register address'] = all_rows[row-1][1].value
                self.reg_dic['registers'][-1]['fields'] = [[value.value for value in all_rows[row-1][2:7]]]
            else:
                self.reg_dic['registers'][-1]['fields'].append([value.value for value in all_rows[row-1][2:7]])
            row += 1
        return self.reg_dic

if __name__ == "__main__":
    reg_dic_obj = ReadRegListExcel(ws)
    reg_dic = reg_dic_obj.construct_dic()
    pp.pprint(reg_dic)

最後得到的暫存器字典如下：

至此讀入暫存器列表檔案並構建出結構化的暫存器字典任務完成。

使用openpyxl庫讀取Excel檔案資料
2023-11-05
Excel
EasyExcel 輕鬆靈活讀取Excel內容
2019-10-22
Excel
python openpyxl讀寫excel
2024-11-25
PythonExcel
【python介面自動化】- openpyxl讀取excel資料
2020-05-20
PythonExcel
PHP 讀取 WORD 內容
2021-08-26
PHP
PHP讀取WORD內容
2021-08-26
PHP
python excel pandas openpyxl
2024-08-20
PythonExcel
多次讀取 HttpServletRequest 中 body 內容
2019-02-23
HTTPServlet
mybatis讀取properties檔案內容
2018-05-28
MyBatis
js 讀取 input file 的內容
2018-07-24
JS
vite vue-cli 讀取檔案原始內容使用base64內容的檔案
2024-05-02
ViteVue
python+excel=openpyxl(二)
2022-12-21
PythonExcel
python+excel=openpyxl(一)
2022-12-20
PythonExcel
poi解析Excel內容
2020-08-26
Excel
Laravel讀取Excel
2020-11-11
LaravelExcel
java檔案相關（檔案追加內容、檔案內容清空、檔案內容讀取）
2018-06-29
Java
用PHP換個思路讀取WORD內容
2021-09-11
PHP
用 ABAP 讀取本地文字檔案內容試讀版
2022-04-03
Spring Boot 讀取配置內容的三種方式
2020-11-06
Spring Boot
Java讀取本地檔案內容並輸出
2020-09-25
Java
讀取resources中properties檔案內容範例
2020-04-04
Python讀取Excel表格
2021-10-20
PythonExcel
Python中用OpenPyXL處理Excel表格
2019-04-10
PythonExcel
將 SAP ABAP 內表內容本地匯出成 Excel 檔案試讀版
2023-03-30
Excel
python excel 內容寫入mysql
2021-09-09
PythonExcelMySql
JavaScript讀取文字檔案內容程式碼例項
2018-06-12
JavaScript
讀取.net core配置檔案appsetting.json內容
2024-07-03
APPJSON
python對Excel的讀取
2019-07-18
PythonExcel
用 (Excel) VBA 讀取 OneNote！
2024-10-22
Excel
前端讀取excel檔案
2024-06-08
前端Excel
Python Excel處理庫openpyxl詳解
2018-05-03
PythonExcel
openpyxl 操作 Excel表的格基本用法
2021-11-29
Excel
使用 FOR ALL ENTRIES 將 ABAP 內表內容作為資料庫表的讀取條件之一試讀版
2023-05-18
資料庫
ABAP--一個讀取EXCEL單元格的內容超過256個字元的程式碼樣例
2020-04-04
Excel字元
dotnet OpenXML 讀取 PPT 內嵌 ole 格式 Excel 表格的資訊
2021-09-02
XMLExcel
基於Xml 的IOC 容器-開始讀取配置內容
2020-11-14
XML
JavaScript讀取本地檔案內容（相容低版本IE）
2021-07-20
JavaScript
python讀取文字內容中文亂碼怎麼解決
2021-09-11
Python