python對excel檔案中指定表格的指定列資料進行去重複操作。

总统先生發表於2024-06-03
import pandas as pd

# 讀取Excel檔案
df_all = pd.read_excel('域名管理系統.xlsx', sheet_name=None, engine='openpyxl')

# 確保'01流水'表存在
if '01流水' in df_all:
    # 提取第1列第2行至第1000行的資料並去重
    df_two = df_all['01流水']
    unique_data = df_two.iloc[1:1000, 0].drop_duplicates().reset_index(drop=True)

    # 檢查並處理'01流水-去重'表
    if '01流水-去重' in df_all:
        # 刪除原有的'01流水-去重'表
        del df_all['01流水-去重']

    # 將去重後的資料新增為新的'01流水-去重'表
    df_all['01流水-去重'] = unique_data

    # 儲存更新後的Excel檔案
    with pd.ExcelWriter('域名管理系統.xlsx', engine='openpyxl') as writer:
        for sheet_name, data_frame in df_all.items():
            data_frame.to_excel(writer, sheet_name=sheet_name, index=False)
else:
    print("Sheet '01流水-去重' not found in the Excel file.")

上述程式碼由阿里雲lingma完成。

功能:將one.xlsx檔案中表two中第1列第2行至1000行的資料進行去重,並將結果儲存到two-uni表格,如果two-uni已存在,則刪除原表格。

需要:我們可以使用pandas庫來處理Excel檔案。

pip install pandas openpyxl

相關文章