Python-Pandas-筆記-20201102-HK

同籠發表於2020-11-02

Pandas庫-筆記整理(1)-20201102

  1. 對多變數的索引重置
物件.reset_index()
  1. 生成對多變數的多統計表
物件表名.groupby(['tag_1', 'Tag_2']).description.agg([呼叫函式_1,  呼叫函式_2])
  1. groupby()預設用index來排序;sort_values(by=[‘變數名1’], [‘變數名2’])可以設定使用表中資料進行排序,預設優先用變數名1排序。

  2. 使用groupby按照某列(A)進行分組後,需要對另外一列(B)採用不同的聚合方法

物件.groupby('A')['B'].agg({'mean':np.mean, 'std': np.std})
  1. 把某個規則處理過的資料-升序排列
物件表名.物件列名,fillna('Unknown').values_counts().sort_values(ascending=False)