Pandas DataFrame常用方法

Just Jump發表於2020-12-20

1、獲取列名
1.1.連結串列推導式
語法:[col for col in df]
返回結果: [‘cvr1’, ‘cvr2’, ‘cvr3’, ‘cvr4’]
結果型別:list
1.2.通過columns屬性
columns屬性返回Index,
columns.values屬性返回 numpy.ndarray,可通過 tolist(), 或者 list(ndarray) 轉換為list

print(type(df.columns))
print(type(df.columns.values))
print(type(df.columns.tolist()),":"+"\n",df.columns.tolist())
print(type(df.columns.values.tolist()),":"+"\n",df.columns.values.tolist())

1.3.直接使用 list ,返回一個含有columnsd的list列表

print(list(df))

返回結果: [‘cvr1’, ‘cvr2’, ‘cvr3’, ‘cvr4’]
結果型別:list

2、讀取多個檔案,合併到一個DataFrame中
2.1 使用萬用字元讀取多個檔案

2.2 迴圈讀取單個檔案,然後concat到一個DataFrame中

train_data_df = pd.DataFrame()
for train_promotion_tag in promotion_list:
	data_csv = "features_for_{job_type}.csv".format(job_type=job_type)
	print("讀取檔案{0}".format(data_csv))
	tmp = pd.read_csv(data_csv)
	train_data_df = pd.concat([train_data_df, tmp],ignore_index=True)

相關文章