Python資料分析 Series 筆記

银河小船儿發表於2024-04-18

002,pandas介紹

003,Series建立

匯入Pandas

Series 是一種類似於一維陣列的物件,由下面兩個部分組成:

  • values:一組資料(ndarray型別)
  • index:相關的資料索引標籤

(3.1)Series的建立

兩種建立方式:

(1)由列表或Numpy陣列建立

  • 預設索引為0到N-1的整數型索引

  • index和values

(2)由字典建立

04,Series顯式索引和隱式索引

Series的索引

可以使用中括號取單個索引(此時返回的是元素型別),或者中括號裡一個列表取多個索引(此時返回的仍然是一個Series型別)。分為顯式索引和隱式索引:

(4.1)顯式索引:

  • 使用index中的元素作為索引值
  • 使用.loc[] 推薦

(4.2)隱式索引

  • 使用整數作為索引值
  • 使用.iloc[] (推薦)

05,Series顯式切片和隱式切片

06,Series基本屬性和方法

(6.1)基本屬性

  • shape 形狀
  • size 長度
  • index 索引
  • value 值
  • name 名字

(6.2)head()和tail()方法

  • head() 檢視前幾條資料,預設5條
  • tail() 檢視後幾條資料,預設5條

(6.3)檢測缺失資料

  • pd.isnull()
  • pd.notnull()
  • isnull()
  • notnull()

(6.4)使用bool值索引過濾資料

第1種方法

第2種方法

07,Series的運算

(7.1)適用於Numpy的陣列運算也適用於Series

(7.2)Series之間的運算

  • 在運算中自動對齊索引
  • 如果索引不對應,則補NaN
  • Series沒有廣播機制

如果 s4的索引不是[0,1,2,3],還是根據對應索引的值進行運算

  • 注意:要想保留所有的index,則需要使用.add()函式

總結:

  • Series:可以看做是一個有序的字典結構

相關文章