問題描述
起初我使用python語言合併多個csv檔案時,存在這幾個csv檔案有不止一個列名相同,僅僅依靠一個列名內容進行合併;
就很容易造成相同列名對應相同內容分別佔據了兩個列,感官極為不好,還會影響到後面的資料清洗;
問題解決
# 在on的這裡加一箇中括號,這樣就能夠同時包括多個列名,依據多個列名進行合併
df_pri12 = pd.merge(df01, df02, on=['城市', '省份'], how='outer')
完美避免了列名_x和列名_y的出現!
起初我使用python語言合併多個csv檔案時,存在這幾個csv檔案有不止一個列名相同,僅僅依靠一個列名內容進行合併;
就很容易造成相同列名對應相同內容分別佔據了兩個列,感官極為不好,還會影響到後面的資料清洗;
# 在on的這裡加一箇中括號,這樣就能夠同時包括多個列名,依據多個列名進行合併
df_pri12 = pd.merge(df01, df02, on=['城市', '省份'], how='outer')
完美避免了列名_x和列名_y的出現!