基於python的大資料分析實戰學習筆記-pandas(資料分析包)

testingbang發表於2019-08-28
pandas中常見的資料結構有三種,Series(一維陣列,也叫序列),DataFrame(二維表格,類似excel多行多列),Panel(三維陣列)


那什麼是資料結構呢?就是相互之間存在的一種或多種特定關係的資料型別的集合。


好了,概念就是這麼簡單,相信有python基礎的朋友應該很容易理解,如果你沒有。。。。恩。。。就沒有吧


今天我們先來介紹下Series的用法,直接擼程式碼,裡面有註釋



from pandas import Series
#定義一個序列
"""
一個序列可以存放不同的資料型別,索引index也是可以忽略的,可以透過下標訪問(從0開始)
執行可能會報錯:
ImportError: C extension: No module named 'pandas._libs.tslib' not built. If you want to import pandas from the source directory, you may need to run 'python setup.py build_ext --inplace --force' to build the C extensions first.
解決方法:
先
pip3 uninstall pandas
在
pip3 install --user pandas
"""
x=Series(['a',True,1],index=['first','second','thrid'])
print('透過下標取值',x[1])
print('透過索引取值',x['second'])
#x[3] 不能越界訪問會報錯
#x.append(666)#不能追加單個元素
n=Series([666],index=['fourth'])#可以追加一個序列
print('新增序列之後',x.append(n))
if 1 in x.values:
    print('good')
    
#切片
print('切片:',x[1:3])
#定位獲取,常用於隨機抽樣
print(x[[0,2,1]])
#刪除
#x.drop(0)#根據下標
#x.drop('first')#根據索引
#按照下標找到索引名
print(x.index[2])
#根據值刪除,返回新序列
#x[2!=x.values
#修改值
x.index[True==x.values]
#將字典轉為series
#Series(字典格式)
#對index進行排序
y=Series([2,3,1,5],index=['a','c','b','d'])
print(y.sort_index(ascending=True))#ascending控制升還是降

OS:寫程式碼雖然累,但確實爽,你還不體驗下?


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69942496/viewspace-2655299/,如需轉載,請註明出處,否則將追究法律責任。

相關文章