資料分析: DataFrame
一.DataFrame的建立(二維陣列,字典)
二.DataFrame的增刪改查
增:1.列增加的三種方式:
(1)df['列名']=[10,20,30]
(2)df.loc[:,'列名']=[10,20,30]
(3)df.insert(插入的位置,'列名',[10,20,30])
2.行增加的三種方式:
(1)df.loc['行名']=[10,20,30]
(2)new_df=pd.DataFrame({'語文':[10,20,30],'英語':[40,50,60]},index=['徐凱','李小龍'])
df.append(new_df)
注意點:列的增加插入的位置從0開始索引,行的增加append會建立一個新的物件
建立DataFrame物件的兩種方式
# 使用二維陣列的方式建立DataFrame物件
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True) # 解決資料輸出行列不對齊
data=[[10,20,30],[40,50,60],[70,80,90]] # 10,20,30在一行
index=['徐凱','周星馳','李小龍']
columns=['數學','語文','英語']
df=pd.DataFrame(data=data,index=index,columns=columns)
print(df)
# 使用字典的方式建立DataFrame物件
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
data={
'語文':[10,20,30], # 10,20,30在一列
'數學':[40,50,60],
'英語':[70,80,90]
}
index=['徐凱','周星馳','李小龍']
df=pd.DataFrame(data=data,index=index)
print(df)
DataFrame的增
# 增加一列物理成績
df['物理'] = [11,22,33]
# 增加一列體育成績
df.loc[:,'體育']=[44,55,66]
# 增加一列化學成績
df.insert(5,'化學',[77,88,99])
# 增加一行‘錢多多’的各科成績
df.loc['錢多多']=[11,12,13,14,15,16]
# 增加多行各科成績
import pandas as pd
pd.set_option('display.unicode.east_asian_width',True)
data={
'語文':[10,20,30],
'數學':[40,50,60],
'英語':[70,80,90]
}
index=['徐凱','周星馳','李小龍']
df=pd.DataFrame(data=data,index=index)
# 方式一
data=[[10,20,30],[49,50,60]]
index=['甄子丹','成龍']
columns=['語文','數學','英語']
new_df=pd.DataFrame(data=data,index=index,columns=columns)
df.append(new_df)
# 方式二
new_df=pd.DataFrame({'語文':[40,50],'數學':[89,99],'英語':[11,22]},index=['甄子丹','成龍'])
df1 = df.append(new_df)
df1 # 會生成一個新的二維列表
DataFrame的刪
# 刪除列
# 方式一
# df.drop(['列名'],axis=1,inplace=True),axis=1是刪除列
drop.drop(['語文'],axis=1, inplace=True)
# 方式二
# df.drop(columns='列名',inplace=True),inplace值為True,替換原陣列
df.drop(columns='數學',inplace=True)
# 方式三
# df.drop(labels='列名',axis=1,inplace=True)
df.drop(labels='數學',axis=1,inplace=True)
# 刪除行
# 方式一
# df.drop(['行索引'],axis=0, inplace=True)
df.drop(['甄子丹'],axis=0,inplace=True)
# 方式二
# df.drop(index='行索引',inplace=True)
df.drop(index='甄子丹',inplace=True)
# 方式三
# df.drop(labels='行索引',axis=0,inplace=True)
df.drop(labels='甄子丹',axis=0,inplace=True)
DataFrame的改
# 修改列標題(需要將所有列的新標題都寫上)
# 方式一
df.columns=['Chinese','Math','English']
# 方式二
df.rename(columns={'Chinese':'語文','Math':'數學','English':'英語'})
# 修改行標題
# 方式一
df.index=list('1234')
# 方式二
df.rename(index={'甄子丹':0,'成龍':1},axis=0,inplace=True)
DataFrame的查
# 抽取一行
df.loc['甄子丹']
# 抽取多行(loc裡面是行索引,iloc裡面是數字)
df.loc[['甄子丹','成龍']]
df.iloc[[0,1]]
# 抽取指定的列
df['數學']
# 抽取多列
df[['數學','英語']]
# 抽取語文分數大於105,數學分數大於88的同學
df.loc[(df['語文']>105)&(df['數學']>88)]
相關文章
- Python資料分析 DataFrame 筆記Python筆記
- python-資料分析-Pandas-3、DataFrame-資料重塑Python
- python-資料分析-Pandas-4、DataFrame-資料透視Python
- Pandas使用DataFrame進行資料分析比賽進階之路(一)
- Rust的資料DataFrame庫有哪些?Rust
- Python 資料結構之DataframePython資料結構
- python pandas DataFrame-A 更新 DataFrame-B中指定列相同的資料Python
- 「python」向DataFrame資料格式中插入行Python
- 基於python的大資料分析實戰學習筆記-pandas之DataFramePython大資料筆記
- pandas 學習(2): pandas 資料結構之DataFrame資料結構
- 用DataFrame作為容器分析市場行情指標指標
- Spark2 載入儲存檔案,資料檔案轉換成資料框dataframeSpark
- Polars:用於 Rust 和 Python的快速資料整理DataFrame庫RustPython
- 資料分析
- 【pyspark】dataframe常用操作Spark
- Pandas - DataFrame.loc
- Spark SQL 1.3.0 DataFrame介紹、使用及提供了些完整的資料寫入SparkSQL
- python遠端連線mysql以及pandas.DataFrame.to_sql寫入資料庫PythonMySql資料庫
- 客快物流大資料專案(四十六):Spark操作Kudu dataFrame操作kudu大資料Spark
- 從零開始資料分析:一個資料分析師的資料分析流程
- 資料模型與資料分析模型
- 分析型資料庫:分散式分析型資料庫資料庫分散式
- python--建立一個與已有DataFrame行數相同的資料框的方式Python
- pyspark.sql.DataFrame與pandas.DataFrame之間的相互轉換SparkSQL
- 資料分析——numpy
- 資料分析02
- 資料分析(1)
- 資料包分析
- 資料塊分析
- 廣告資料分析
- 資料分析--資料預處理
- 資料探勘的資料分析方法
- 資料分析 | 資料清理的方法
- PySpark筆記(三):DataFrameSpark筆記
- Spark建立空的DataFrameSpark
- PySpark DataFrame教程與演示Spark
- 電商資料分析必備的4種資料分析方法
- 圖解資料分析 | 資料分析的數學基礎圖解