Python資料分析 Pandas模組 基礎資料結構與簡介

嬌兮心有之發表於2018-12-14

本人對於Python學習建立了一個小小的學習圈子,為各位提供了一個平臺,大家一起來討論學習Python。歡迎各位到來Python學習群:960410445一起討論視訊分享學習。Python是未來的發展方向,正在挑戰我們的分析能力及對世界的認知方式,因此,我們與時俱進,迎接變化,並不斷的成長,掌握Python核心技術,才是掌握真正的價值所在。

簡介

pandas 組成 = 資料皮膚 + 資料分析工具

poandas 把陣列分為3類

一維矩陣:Series 把ndarray強大在可以儲存任意資料型別可以專門處理時間資料

二維矩陣:DataFrame

三維皮膚資料:Panel

背景: 為金融產品資料分析建立的,對時間序列支援非常好!

資料結構

匯入pandas模組

import pandas as pd
讀取csv檔案,資料型別就是二維矩陣 DataFrame

df = pd.read_csv('路徑')
type(df)
屬性和方法

型別: type(df)

維度: df.ndim

形狀: df.shape

大小: df.size

資料型別: a.dtypes

幫助: help(df)

索引操作

前N行:head(N)

後N行:tail(N)

第N行:df.loc[索引]

第3-7行:df.loc[2:8]

取任意行:df.loc[[1,3,5....]]

取某列:df['列名'] df.列名

取任意列:df[['列名1','列名2',...]]

簡單統計

摘要描述/簡介:df.describe()

一維.value_counts() 統計一維矩陣中數值出現的次數

比如:統計成績!!

最大:df['列名'].max()

最小:df['列名'].min()

平均:df['列名'].mean()

標準差:std()

相關文章