Python 中 Panda 庫 處理表格方法

constantinealicia發表於2024-03-14
1. 匯入 Pandas 庫
  import pandas as pd
2. 建立 DataFrame 物件
  # 從列表建立 data = [['Alice', 25], ['Bob', 30], ['Charlie', 35]] df = pd.DataFrame(data, columns=['Name', 'Age']) # 從字典建立 data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age':        [25, 30, 35]} df = pd.DataFrame(data)
3. 檢視 DataFrame 資料
  # 檢視前幾行,預設顯示前5行 df.head() # 檢視後幾行,預設顯示後5行 df.tail() # 檢視列名 df.columns # 檢視資料統計資訊 df.describe()
4. 訪問 DataFrame 資料
  # 按列名訪問資料 df['Name'] # 單列 df[['Name', 'Age']] # 多列 # 按行索引訪問資料 df.iloc[0] # 第一行 df.iloc[0:2] # 前兩行
5. 條件篩選和過濾
  # 根據條件篩選行 df[df['Age'] > 30] # 年齡大於30的行 # 根據條件篩選列 df.loc[:, df.columns != 'Name'] # 排除 Name 列的所有列 # 多個條件的組合篩選 df[(df['Age'] > 25) & (df['Age'] < 35)]
6. 資料排序
  # 按某一列升序排序 df.sort_values('Age') # 按某一列降序排序 df.sort_values('Age', ascending=False)
7. 新增和更新資料
  # 新增新列 df['Gender'] = ['Female', 'Male', 'Male'] # 更新某行資料為Alice,列名位Age的位置的值 df.loc[df['Name'] == 'Alice', 'Age'] = 26
8. 資料匯入和匯出
  # 從 CSV 檔案匯入資料 df = pd.read_csv('data.csv') # 匯出資料到 CSV 檔案 df.to_csv('new_data.csv', index=False) # 從 Excel 檔案匯入資料 df = pd.read_excel('data.xlsx') # 匯出資料到 Excel 檔案 df.to_excel('new_data.xlsx', index=False)

相關文章