pandas索引和選擇資料

sljwy發表於2020-12-28

原文網址 : https://shenlong.blog.csdn.net/article/details/111829599

使用pandas索引和選擇資料時，總是需要百度，因此決定對pandas.DataFrame中的索引和選擇方法做個總結。所用的pandas版本號為0.20.1
pandas中有三種索引方法：.loc，.iloc和[]，注意：.ix的用法在0.20.0中已經不建議使用了！

下文中全部使用一個DataFrame來舉例：
這裡寫圖片描述

.loc用法

.loc主要是基於標籤(label)的，包括行標籤(index)和列標籤(columns)，即行名稱和列名稱，可以使用df.loc[index_name,col_name]，選擇指定位置的資料，其它的用法有：
1. 使用單個標籤。如果.loc[]中只有單個標籤，那麼選擇的是某一行。 df.loc[3]選擇的是index名為‘3’的一行，注意這裡的’3’是index的名稱，而不是序號
這裡寫圖片描述
2. 使用標籤的list：同樣是只選擇行

3. 標籤的切片物件：與通常的python切片不同，在最終選擇的資料中包含切片的start和stop

4. 布林型的陣列：通常用於篩選符合某些條件的行

5. 可呼叫的函式
這裡寫圖片描述
lambda表示式語法：
lambda 傳入引數：返回的計算表示式

iloc用法

iloc是基於位置的索引，利用元素在各個軸上的索引序號進行選擇，序號超出範圍會產生IndexError，切片時允許序號超過範圍，用法包括：
1. 使用整數：與.loc相同，如果只使用一個維度，則對行選擇，下標從0開始
這裡寫圖片描述
2. 使用列表或陣列，同樣是對行選擇

3. 元素為整數的切片物件：與.loc不同的是，這裡下標為stop的資料不被選擇

也可以對列進行切片：

4. 使用布林陣列進行篩選：注意這裡可以使用list或者array，使用Series的話會出錯，NotImplementedError或者ValueError，前者是Series的index與待切片DataFrame的index不同時，後者是index相同時報的錯，可以自己實現體會一下。與.loc使用布林陣列，可以使用list， array，也可以使用Series，使用Series時index需要一致，否則會報IndexingError
這裡寫圖片描述
5.使用可呼叫函式

切片操作`[]`

[]操作只能輸入一個維度，不能用逗號隔開輸入兩個維度：
1. 使用列名：.loc和iloc只輸入一維時選取的是行，而[]選取的是列，並且必須使用列名
2. 使用布林陣列：bool陣列的index需要和dataframe的index一致，此時選取的是行
  
  因此可以用來篩選符合條件的行：
避免chained assignment
在對資料賦值使可以有以下兩種操作：
df.loc[df.C>0.5,'C']=0.6
df[df.C>0.5][['C']]=0.6
上面的操作可以在df上直接修改資料，而下面的操作被稱為chained assignment,會產生SettingWithCopyWarning，官網上的解釋：indexing-view-versus-copy。直觀來說就使用chained assignment無法預測是否能對資料df進行修改，使用loc一定是直接在df上修改資料，因此建議使用loc

pandas 學習第14篇：索引和選擇資料
2020-12-15
索引
資料庫索引選擇策略
2024-08-26
資料庫索引
44 pandas DataFrame分層索引切片選擇（tcy）
2019-01-06
索引
唯一索引和普通索引的選擇
2020-04-13
索引
MySQL資料庫索引選擇使用B+樹
2020-04-04
MySql資料庫索引
普通索引和唯一索引，應該怎麼選擇？
2022-03-03
索引
表資料量影響MySQL索引選擇
2018-10-27
MySql索引
如何選擇普通索引和唯一索引《死磕MySQL系列五》
2021-11-03
索引MySql
ICI選擇Woolpert收集資料和影像
2022-07-08
Elasticsearch 中為什麼選擇倒排索引而不選擇 B 樹索引
2021-10-26
Elasticsearch索引
MySQL 資料型別分類和選擇
2024-01-22
MySQL 資料型別
pandas：多層索引
2022-06-04
索引
使用C#選擇資料夾、開啟資料夾、選擇檔案
2019-01-08
C#
PostgreSQL資料庫多列複合索引的欄位順序選擇原理
2018-04-18
SQL資料庫索引
MySQL索引選擇及規則整理
2018-09-13
MySql索引
微服務間如何選擇推送和拉取資料
2019-02-26
微服務
Uniapp 城市選擇JSON資料
2024-06-08
APPJSON
資料遷移方案選擇
2021-08-11
PostgreSQL：資料庫的選擇
2020-11-30
SQL資料庫
pandas（3）：索引Index/MultiIndex
2021-04-20
索引Index
[20190827]函式索引與選擇率.txt
2019-08-28
函式索引
wpf winform 選擇檔案或選擇資料夾程式碼
2020-11-17
ORM
資料跟蹤應該是選擇加入而不是選擇退出
2019-05-29
資料結構32：選擇排序
2020-09-27
資料結構排序
MySQL innodb如何選擇一個聚簇索引
2018-10-12
MySql索引
[20200326]為什麼選擇這個索引.txt
2020-03-26
索引
索引選擇度問題最佳化整理
2022-12-24
索引
pandas 設定二級索引
2024-05-24
索引
資料結構和演算法：03.冒泡、選擇排序
2020-10-30
資料結構演算法排序
如何選擇大資料分析軟體
2022-03-14
大資料
爬蟲中資料清洗的選擇
2021-06-12
爬蟲
mysql索引為啥要選擇B+樹 (下)
2019-03-17
MySql索引
mysql索引為啥要選擇B+樹 (上)
2019-03-09
MySql索引
Python - pandas 資料分析
2020-04-05
Python
每日安全資訊：資料跟蹤應該是選擇加入而不是選擇退出
2019-05-29
Pandas庫基礎分析——資料生成和訪問
2019-02-16
pandas 處理資料和crc16計算
2020-09-26
46 pandas reindex-重新索引（tcy）
2019-01-09
Index索引

pandas索引和選擇資料

.loc用法

iloc用法

切片操作[]

相關文章

切片操作`[]`