在 Python 中,讀取 CSV(逗號分隔值)檔案是資料處理中的常見任務。以下將介紹一些高階的方法來讀取 CSV 檔案:
使用 pandas 庫讀取 CSV 檔案
import pandas as pd
df = pd.read_csv('file.csv')
print(df)
pandas 是一個強大的資料處理庫,read_csv 函式可以方便地讀取 CSV 檔案並將其轉換為 DataFrame 物件,便於進行後續的資料處理和分析。
使用 csv 模組讀取 CSV 檔案
import csv
with open('file.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
csv.reader 可以逐行讀取 CSV 檔案的內容,並將每一行作為一個列表返回。
讀取特定列的資料
import pandas as pd
df = pd.read_csv('file.csv')
selected_columns = df[['column1', 'column2']]
print(selected_columns)
使用 pandas 可以方便地選擇讀取 CSV 檔案中的特定列。
處理 CSV 檔案中的日期列
import pandas as pd
df = pd.read_csv('file.csv', parse_dates=['date_column'])
print(df)
透過 parse_dates 引數可以將 CSV 檔案中的日期列自動解析為日期型別。
跳過檔案的前幾行
import pandas as pd
df = pd.read_csv('file.csv', skiprows=2)
print(df)
使用 skiprows 引數可以跳過 CSV 檔案的前幾行。
處理大型 CSV 檔案
當 CSV 檔案非常大時,一次性將其全部讀入記憶體可能會導致記憶體不足的問題。可以使用逐塊讀取的方式來處理:
import pandas as pd
chunk_size = 1000 # 每次讀取的行數
for chunk in pd.read_csv('file.csv', chunksize=chunk_size):
# 在這裡對每一塊資料進行處理
print(chunk)
本文部分轉自:https://www.wodianping.com/app/2024-10/48782.html