pandas小習題

沒有翅膀卻像飛向天空發表於2020-10-13
import numpy as np
import pandas as pd
from pandas import DataFrame,Series
df_tb1=pd.read_csv("baby_trade.csv")
df_tb2=pd.read_csv("baby_info.csv")
date=df_tb2['birthday'].astype('str')#轉換型別
type(day)#檢視型別
year=df_tb2['birthday'].astype('str').apply(lambda x:x[0:4])#擷取前4列
year.astype('int')#轉換成int型別
age=year.astype('int').apply(lambda x: 2020-x)#現在時間減去出生日期
df_tb2['age']=age#新增新的一列
df_tb2

執行結果:
在這裡插入圖片描述

day=df_tb2['day'].astype('str')#轉換型別
type(day)#檢視型別
day=df_tb2['day'].astype('str').apply(lambda x:x[0:4])
day
day.astype('int')
df_tb2['2013~2015年銷售量']=day
df_tb2

執行結果:
在這裡插入圖片描述

df_tb2.groupby('2013~2015年銷售量').sum().sort_values(by='2013~2015年銷售量', ascending=False).head(3)['buy_mount']#分組求和排序

執行結果:
在這裡插入圖片描述

num=df_tb2['gender'].value_counts().values#對gender分組求和
num=np.unique(num)#刪除重複
num=np.append(num,955)#新增一列為總數量
num=DataFrame(num,index=['不知道','男','女','總數量'])
num.T#橫向輸出

執行結果:
在這裡插入圖片描述

ages=df_tb2['age'].value_counts().sort_index().values
ages=np.append(ages,955)
ages=DataFrame(ages,index=['五歲','六歲','七歲','八歲','九歲','十歲','十一歲','十二歲','十三歲','十四歲','十五歲','十六歲','十七歲','十八歲','三十六歲','總數量'])
ages.T

執行結果:
在這裡插入圖片描述

相關文章