002,pandas介紹
003,Series建立
匯入Pandas
Series 是一種類似於一維陣列的物件,由下面兩個部分組成:
- values:一組資料(ndarray型別)
- index:相關的資料索引標籤
(3.1)Series的建立
兩種建立方式:
(1)由列表或Numpy陣列建立
- 預設索引為0到N-1的整數型索引
- index和values
(2)由字典建立
04,Series顯式索引和隱式索引
Series的索引
可以使用中括號取單個索引(此時返回的是元素型別),或者中括號裡一個列表取多個索引(此時返回的仍然是一個Series型別)。分為顯式索引和隱式索引:
(4.1)顯式索引:
- 使用index中的元素作為索引值
- 使用.loc[] 推薦
(4.2)隱式索引
- 使用整數作為索引值
- 使用.iloc[] (推薦)
05,Series顯式切片和隱式切片
06,Series基本屬性和方法
(6.1)基本屬性
- shape 形狀
- size 長度
- index 索引
- value 值
- name 名字
(6.2)head()和tail()方法
- head() 檢視前幾條資料,預設5條
- tail() 檢視後幾條資料,預設5條
(6.3)檢測缺失資料
- pd.isnull()
- pd.notnull()
- isnull()
- notnull()
(6.4)使用bool值索引過濾資料
第1種方法
第2種方法
07,Series的運算
(7.1)適用於Numpy的陣列運算也適用於Series
(7.2)Series之間的運算
- 在運算中自動對齊索引
- 如果索引不對應,則補NaN
- Series沒有廣播機制
如果 s4的索引不是[0,1,2,3],還是根據對應索引的值進行運算
- 注意:要想保留所有的index,則需要使用.add()函式
總結:
- Series:可以看做是一個有序的字典結構