Python自動化處理Excel資料

qwerrt9發表於2023-11-01

原文網址 : https://www.cnblogs.com/lcl-cn/p/17804280.html

PythonExcel

需求描述：資料格式如下所示，需要分離出2023年7月1號之後的資料明細

資料核對與處理：從Excel檔案中提取特定日期後的簽收資料

1. 引言

在實際資料處理和分析過程中，經常會遇到需要從大量資料中提取出特定日期範圍內的資訊的需求。本文將介紹如何使用Python的pandas庫來處理Excel檔案，並提取出2023年7月1日之後的簽收資料。

2. 準備工作

首先，我們需要匯入所需的庫。在本文中，我們將使用pandas庫來處理Excel檔案。

import pandas as pd

3. 設定顯示選項

為了能夠正確顯示所有列和行，我們可以設定pandas的顯示選項。

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

4. 讀取Excel資料檔案

接下來，我們使用pd.read_excel()函式來讀取Excel檔案中的資料，並指定nrows引數來限制讀取的行數。

data = pd.read_excel('C:\\Users\\Admin\\Desktop\\資料核對\\工作簿2.xlsx', nrows=600)

5. 資料處理

為了方便後續操作，我們將DataFrame的索引設定為“貨件單號”和“SKU”。

data = data.set_index(['貨件單號', 'SKU'])

然後，我們將“簽收明細”這一列進行拆分，並將拆分後的每個資料項排成多行。

data = data['簽收明細'].str.split('\n', expand=True).stack().reset_index(level=2, drop=True)
data.name = '簽收明細'

接著，我們從拆分後的資料中提取出“日期”和“數量”兩列，並將其轉換為正確的資料型別。

data = data.str.split(' \| ', expand=True)
data.columns = ['日期', '數量']
data['日期'] = pd.to_datetime(data['日期'])
data['數量'] = pd.to_numeric(data['數量'])

6. 篩選資料並儲存結果

現在，我們可以篩選出2023年7月1日之後的資料，並將結果儲存到Excel檔案中。

result = data[data['日期'] >= '2023-07-01'].reset_index()
result.to_excel('2023年7月1號之後簽收資料.xlsx', index=True)

7. 結果展示

最後，我們輸出提示資訊，顯示結果已經儲存到檔案中。

print(f"結果已經儲存到檔案中：2023年7月1號之後簽收資料.xlsx")

8. 總結

本文介紹瞭如何使用Python的pandas庫處理Excel檔案，並提取出特定日期範圍內的簽收資料。透過設定顯示選項、讀取Excel檔案、進行資料處理、篩選資料並儲存結果，我們能夠高效地處理大量資料，並得到我們需要的資訊

完整程式碼:

import pandas as pd

# 設定最大列數為 None，以顯示所有列
pd.set_option('display.max_columns', None)

# 設定最大行數為 None，以顯示所有行
pd.set_option('display.max_rows', None)

# 讀取Excel資料檔案
data = pd.read_excel('C:\\Users\\Admin\\Desktop\\資料核對\\工作簿2.xlsx', nrows=600)

# 輸出全部資料（顯示所有行和列）
print(data)

# 將DataFrame的索引設定為“貨件單號”和“SKU”，以便後續操作
data = data.set_index(['貨件單號', 'SKU'])

# 將“簽收明細”這一列進行拆分，並將拆分後的每個資料項排成多行
data = data['簽收明細'].str.split('\n', expand=True).stack().reset_index(level=2, drop=True)
data.name = '簽收明細'

# 從拆分後的資料中提取“日期”和“數量”兩列
data = data.str.split(' \| ', expand=True)
data.columns = ['日期', '數量']
data['日期'] = pd.to_datetime(data['日期'])
data['數量'] = pd.to_numeric(data['數量'])

# 篩選出 2023 年 7 月 1 日之後的資料，並將結果儲存到 Excel 檔案中
result = data[data['日期'] >= '2023-07-01'].reset_index() # 篩選符合條件的行，並重置索引
result.to_excel('2023年7月1號之後簽收資料.xlsx', index=True) # 將結果儲存到 Excel 檔案中

# 輸出提示資訊
print(f"結果已經儲存到檔案中：2023年7月1號之後簽收資料.xlsx")

【Python自動化Excel】pandas處理Excel資料的基本流程
2022-01-09
PythonExcel
【Python自動化Excel】pandas處理Excel的“分分合合”
2022-02-22
PythonExcel
如何在 Python 中自動化處理 Excel 表格？
2021-11-26
PythonExcel
Python資料處理（二）：處理 Excel 資料
2019-02-16
PythonExcel
Excel檔案利用MySQL/Python 實現自動處理資料的功能
2023-02-21
ExcelMySqlPython
Python使用xlrd處理excel資料
2020-11-19
PythonExcel
【python介面自動化】- openpyxl讀取excel資料
2020-05-20
PythonExcel
Excel 資料處理
2022-07-21
Excel
Python自動化測試-使用Pandas來高效處理測試資料
2019-05-30
Python
python EXCEL處理
2021-09-20
PythonExcel
小夥用Python對Excel資料進行自動處理指令碼，追到了人事小姐姐
2018-12-03
PythonExcel指令碼
python遍歷迭代器自動鏈式處理資料
2022-01-08
Python
使用Excel高效處理資料
2022-07-20
Excel
60萬行的Excel資料，Python輕鬆處理
2019-01-14
ExcelPython
python 獲取excel資料自動登陸
2019-02-21
PythonExcel
Python excel表格讀寫，格式化處理
2018-08-31
PythonExcel
聲網崩潰資料的自動化閉環處理
2022-03-31
介面自動化測試-apiAutoTest 優化之資料依賴處理
2020-11-19
API優化
【Python自動化Excel】Python與pandas字串操作
2022-03-31
PythonExcel字串
python 處理資料
2020-10-29
Python
介面自動化測試：apiAutoTest使用re 處理資料依賴
2020-11-19
API
Python 辦公自動化之 Excel（一）
2020-11-12
PythonExcel
Python 實現自動化 Excel 報表
2021-03-31
PythonExcel
Python 潮流週刊#52：Python 處理 Excel 的資源
2024-05-25
PythonExcel
Python中用OpenPyXL處理Excel表格
2019-04-10
PythonExcel
Python web自動化爬蟲-selenium/處理驗證碼/Xpath
2024-07-18
PythonWeb爬蟲
python介面自動化（三十七）-封裝與呼叫--讀取excel 資料（詳解）
2019-05-20
Python封裝Excel
python 介面自動化 -- 依賴資料
2020-07-07
Python
Python Excel處理庫openpyxl詳解
2018-05-03
PythonExcel
使用 Nim 和 Python 自動化處理登入和驗證碼
2024-11-29
Python
python自動化處理，獲得免費wps會員，雲函式
2021-02-18
Python函式
[資料處理]python基礎
2019-02-02
Python
Python資料處理典型用法
2024-11-03
Python
Python資料處理-pandas用法
2020-12-17
Python
Python辦公自動化：效率飛躍，自動化批次彙總Excel到Word
2024-07-17
PythonExcel
Excel高階應用教程：資料處理與資料分析
2018-05-25
Excel
汙水處理自動化控制與汙水處理廠集中控制
2022-04-19
【python介面自動化】- PyMySQL資料連線
2021-02-12
PythonMySql