python中合併表格的兩種方法

joytoy發表於2021-09-11

python中合併表格的兩種方法

合併表格要注意的是設定表格的表頭,也就是是將表格第一列設定為合併表格的索引,這樣合併表格的時候就會合並兩個表格第一列的元素相同的行。

方法一:使用join合併

import numpy as np
import pandas as pd
import matplotlib as plt
id1=pd.read_csv('/Users/wuwu/Desktop/2021_ICM_Problem_D_Data/id4.csv')
dba=pd.read_csv('/Users/wuwu/Desktop/2021_ICM_Problem_D_Data/dba2.csv')
id1.head()
df1=id1.set_index('influencer_name')
df2=dba
df2=dba.set_index('influencer_name')
w=df1.join(df2)
w.info()

方法二:使用merge合併

import numpy as np
import pandas as pd
import matplotlib as plt
id4=pd.read_csv('/Users/wuwu/Desktop/2021_ICM_Problem_D_Data/id4.csv')
dba=pd.read_csv('/Users/wuwu/Desktop/2021_ICM_Problem_D_Data/dba2.csv')
id4.head()
df1=id4.set_index('influencer_name')
df2=dba
df2=dba.set_index('influencer_name')
df3 = pd.merge(df1,df2,how='inner',on='influencer_name')
print(df3)
df3.to_csv('/Users/wuwu/Desktop/2021_ICM_Problem_D_Data/alldataexceptyear.csv')

以上兩種合併輸出的結果不同,但how=‘inner’ 定義的是表格內部的合併,合併的是兩個表格相似的地方。

pd.merge(df1,df2,how='inner',on='influencer_name')

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4650/viewspace-2830665/,如需轉載,請註明出處,否則將追究法律責任。

相關文章