資料處理踩過的坑(不斷更新):

爬蟲爬呀爬發表於2019-04-18

1.使用布林掩碼作為索引過濾資料:(4.18)

  • 一、對陣列或Series用布林陣列進行過濾,濾去對應位置為False的值,只保留對應位置為True的值:
  1. 對陣列:
    資料處理踩過的坑(不斷更新):
  2. 對Series:
    資料處理踩過的坑(不斷更新):
  • 二、對DataFrame用布林陣列進行過濾,在False的位置填充預設值(注意區別):
    資料處理踩過的坑(不斷更新):
    此時,若想要在特定的某一列中尋找特定的值:
    資料處理踩過的坑(不斷更新):
    若想要選取存在絕對值大於1.5的資料的行,通過布林陣列配合any()實現:

資料處理踩過的坑(不斷更新):
總結:若想通過僅布林陣列直接選取特定的值,則布林陣列不能是DataFrame形式

2.DataFrame物件才能使用.join()方法:(4.18)

合併資料集的時候發現報錯:

資料處理踩過的坑(不斷更新):
檢查發現,
資料處理踩過的坑(不斷更新):
所以,
資料處理踩過的坑(不斷更新):

相關文章