Python資料分析之merge使用

是羅羅攀啊發表於2017-05-19

在現實生活中,都會存在不同的表,但表之間有相互關係,我們需要進行整理,進行連線,這種過程類似於資料庫的連線。
我們先構造使用者和訂單的dataframe:

import pandas as pd
import numpy as np
import datetime
customers = {
    `CustomerID`:[10,11],
    `Name`:[`xiaomin`,`zhansan`],
    `Address`:[`csuft`,`changsha`]
}
customers = pd.DataFrame(customers)
customers
3629157-ff4798f60c791b48.jpg
orders = {
    `CustomerID`:[10,11,10],
    `OrderDate`:[
        datetime.date(2016,12,1),
        datetime.date(2016,12,1),
        datetime.date(2016,12,2)
    ]
}
orders = pd.DataFrame(orders)
orders
3629157-1baa3a06b1926b4f.jpg

通過merge進行連線:

customers.merge(orders)
3629157-8ee3fd52c28eb468.jpg

預設情況下使用inner連線。其他方法類似,在這裡不在講解。


相關文章