Python 高階技巧：深入解析讀取 Excel 檔案的多種方法

我点评开发者社区發表於2024-10-05

原文網址 : https://www.cnblogs.com/wodianpingcom/p/18448380

一、引言

在資料分析和處理中，經常需要從 Excel 檔案中讀取資料。Python 提供了多種庫來實現這個功能，本文將深入探討使用 pandas、openpyxl 和 xlrd 庫讀取 Excel 檔案的高階技巧和程式碼實現。

二、使用 pandas 庫讀取 Excel 檔案

pandas 是 Python 中強大的資料處理庫，提供了方便的函式來讀取 Excel 檔案。

import pandas as pd

# 讀取 Excel 檔案
df = pd.read_excel('example.xlsx')

# 列印資料框的前幾行
print(df.head())

三、使用 openpyxl 庫讀取 Excel 檔案

openpyxl 是一個用於處理 Excel 2010 xlsx/xlsm/xltx/xltm 檔案的 Python 庫。

from openpyxl import load_workbook

# 載入工作簿
wb = load_workbook('example.xlsx')

# 獲取工作表
sheet = wb.active

# 遍歷工作表中的資料
for row in sheet.iter_rows():
    for cell in row:
        print(cell.value)

四、使用 xlrd 庫讀取 Excel 檔案

xlrd 是一個用於讀取 Excel 檔案的 Python 庫，但它不支援 xlsx 檔案格式，只支援 xls 檔案格式。

import xlrd

# 開啟 Excel 檔案
workbook = xlrd.open_workbook('example.xls')

# 獲取工作表
sheet = workbook.sheet_by_index(0)

# 遍歷工作表中的資料
for row_index in range(sheet.nrows):
    row_data = sheet.row_values(row_index)
    print(row_data)

五、處理複雜的 Excel 格式

在實際應用中，Excel 檔案可能具有複雜的格式，如合併單元格、資料驗證等。我們可以使用相應的庫來處理這些情況。

# 使用 openpyxl 處理合併單元格
from openpyxl import load_workbook

wb = load_workbook('example.xlsx')
sheet = wb.active

merged_cells = sheet.merged_cells.ranges

for merged_cell in merged_cells:
    min_row, min_col, max_row, max_col = merged_cell.min_row, merged_cell.min_col, merged_cell.max_row, merged_cell.max_col
    top_left_cell_value = sheet.cell(row=min_row, column=min_col).value
    for row in range(min_row, max_row + 1):
        for col in range(min_col, max_col + 1):
            sheet.cell(row=row, column=col).value = top_left_cell_value

六、效能最佳化

當處理大型 Excel 檔案時，效能可能成為一個問題。我們可以採取一些最佳化措施，如分塊讀取、只讀取需要的列等。

# 使用 pandas 分塊讀取 Excel 檔案
import pandas as pd

chunk_size = 1000  # 每次讀取的行數

reader = pd.read_excel('large_file.xlsx', chunksize=chunk_size)

for chunk in reader:
    # 在這裡處理每一塊資料
    print(chunk)

本文部分程式碼轉自：https://www.wodianping.com/app/2024-10/40486.html

Python 高階程式設計：深入解析 CSV 檔案讀取
2024-10-08
Python程式設計
python讀取大檔案的幾種方法
2021-03-01
Python
python讀取檔案指定行的三種方法
2024-04-28
Python
Python逐行讀取檔案常用的三種方法！
2023-11-09
Python
Python讀寫EXCEL檔案常用方法大全
2020-12-19
PythonExcel
前端讀取excel檔案
2024-06-08
前端Excel
python讀取yaml配置檔案的方法
2024-04-25
PythonYAML
深入解析 Spring 配置檔案：從基礎到高階
2024-07-23
Spring
Python|讀、寫Excel檔案(三種模組三種方式)
2019-02-16
PythonExcel
python讀寫excel檔案
2018-10-06
PythonExcel
【python】python初學讀取map檔案資料到excel中
2020-12-21
PythonExcel
python讀取文字檔案內容的方法主要分為哪三種？
2022-05-23
Python
python檔案讀取 readlines()方法之坑
2021-09-09
Python
讀取本地Excel檔案生成echarts
2020-12-07
ExcelEcharts
python讀取兩個excel資料檔案輸出整理好以後的excel資料檔案
2020-10-19
PythonExcel
Excel求和只有sum求和？多種高階求和方法都在這裡了！
2018-12-05
Excel
Python實用方法之讀取本地檔案
2021-09-11
Python
Maatwebsite\Excel 讀取帶公式的excel檔案得到值呢?
2021-05-10
WebExcel公式
Python讀取大量Excel檔案並跨檔案批次計算平均值
2023-02-01
PythonExcel
python程式碼讀取遠端檔案的方法--paramiko
2019-04-15
Python
nodejs 讀取excel檔案，並去重
2019-02-16
NodeJSExcel
Python最常用的讀取指定路徑檔案的方法！
2024-01-09
Python
python讀取大檔案
2018-07-04
Python
python小白檔案讀取
2020-09-28
Python
python 讀取文字檔案
2024-08-10
Python
python對Excel的讀取
2019-07-18
PythonExcel
多個excel檔案合併成一個excel表的方法如何快速合併多個excel檔案
2022-02-08
Excel
iOS檔案的高階快取– DDGDataCache_OC 快取庫的高階用法
2019-02-27
iOS快取
iOS檔案的高階快取-- DDGDataCache_OC 快取庫的高階用法
2018-05-29
iOS快取
Android讀取配置檔案的方法
2019-08-18
Android
php讀取檔案的幾種方式
2021-09-09
PHP
「Excel技巧」Excel技巧之如何看檔案裡的巨集？
2020-07-02
Excel
python中讀取檔案的read、readline、readlines方法區別
2018-11-09
Python
大神教你python 讀取檔案並把矩陣轉成numpy的兩種方法
2020-07-12
Python矩陣
［深入理解Redis］讀取RDB檔案
2019-03-04
Redis
使用openpyxl庫讀取Excel檔案資料
2023-11-05
Excel
Python讀取Excel表格
2021-10-20
PythonExcel
python如何讀取大檔案
2021-09-11
Python

Python 高階技巧：深入解析讀取 Excel 檔案的多種方法

相關文章