04-3 pandas 中 pd.Categorical用法

luqin_發表於2018-11-01

原文網址 : https://blog.csdn.net/lq_520/article/details/83616673

pandas.Categorical（values，categories = None，ordered = None，dtype = None，fastpath = False ）[source]
表示經典R / S-plus方式的分類變數

分類只能採用有限的，通常是固定數量的可能值（類別）。與統計分類變數相比，分類可能具有順序，但數值運算（加法，除法，…）是不可能的。

分類的所有值都在類別或np.nan中。在類別之外分配值將引發ValueError。順序由類別的順序定義，而不是值的詞彙順序。

引數：

值：類似列表。分類的值，如果給出了類別，則不在類別中的值將替換為NaN。
類別：索引式（唯一），可選。此分類的唯一類別。如果沒有給出，則假定類別是值的唯一值。
ordered：布林值，（預設為False）。此分類是否被視為有序分類。如果沒有給出，則不會訂購生成的分類。
dtype：CategoricalDtype，CategoricalDtype用於此分類的例項

舉：

ValueError異常：如果類別不驗證。
型別錯誤：如果ordered=True給出了顯式但沒有類別且值不可排序。
下面我們來看例項：

In [16]: st = ['a','a','b','c','c']

In [17]: ss = pd.Categorical(st)

In [18]: ss
Out[18]:
[a, a, b, c, c]
Categories (3, object): [a, b, c]

In [22]: ss.dtype
Out[22]: CategoricalDtype(categories=['a', 'b', 'c'], ordered=False)

這裡就可以看到 categorical 實際上是計算一個列表型資料中的類別數，即不重複項，它返回的是一個CategoricalDtype 型別的物件，相當於在原來資料上附加上類別資訊，
具體的類別可以透過和對應的序號可以透過 codes 和 categories 來檢視：

In [23]: ss.codes
Out[23]: array([0, 0, 1, 2, 2], dtype=int8)
In [21]: ss.categories
Out[21]: Index(['a', 'b', 'c'], dtype='object')

有序分類可以根據類別的自定義順序進行排序，並且可以具有最小值和最大值。

>>>c = pd.Categorical(['a','b','c','a','b','c'], ordered=True, categories=['c', 'b', 'a'])
>>> c
[a, b, c, a, b, c]
Categories (3, object): [c < b < a]
>>> c.min()
'c'

屬性

categories	這種分類的類別。
codes	此類別的類別程式碼。
ordered	類別是否具有有序關係
dtype	在CategoricalDtype此例項

pandas用法大全
2018-09-08
pandas用法總結
2020-04-05
pandas中loc、iloc與ix的用法比較
2018-09-05
Pandas高階教程之:GroupBy用法
2021-07-12
Python資料處理-pandas用法
2020-12-17
Python
Pandas資料視覺化工具——Seaborn用法整理
2019-01-30
視覺化
前置機器學習（四）：一文掌握Pandas用法
2020-12-13
機器學習
【Pandas學習筆記02】-資料處理高階用法
2021-12-01
筆記
高手系列！資料科學傢俬藏pandas高階用法大全 ⛵
2022-12-01
資料科學
Pandas中resample方法詳解
2020-12-22
Go 中 ...用法
2021-12-29
Go
golang 中fmt用法
2018-09-18
Golang
js中的this用法
2018-05-03
JS
MySQL 中 WITH ROLLUP 用法
2024-03-26
MySql
MongoDB中regex用法
2020-12-02
MongoDB
Pandas中時間和日期處理
2019-02-16
pandas中的series資料型別
2019-01-18
資料型別
pandas中dataframe與dict相互轉換
2024-10-09
python中pandas的知識點整理
2021-09-11
Python
Pandas中apply、applymap、map的區別
2020-12-12
APP
Pandas之:Pandas簡潔教程
2021-06-05
Pandas
2024-10-22
oracle中substr() instr() 用法
2018-11-09
Oracle
MYSQL中replace into的用法
2019-03-01
MySql
MySQL中limit的用法
2018-07-03
MySqlMIT
js中的||與&&用法
2018-07-04
JS
iOS 中 cell的用法
2018-08-23
iOS
Java中DecimalFormat的用法
2018-06-06
JavaDecimalORM
linux中grep基本用法
2018-08-13
Linux
Java 8 中Stream用法
2024-05-27
Java
python中return的用法
2019-08-28
Python
golang中channel的用法
2020-11-09
Golang
python中的eval用法
2020-11-02
Python
DataTable中的select()用法
2024-10-17
Python中if的基本用法
2024-12-03
Python
Java中super的用法
2022-01-18
Java
mySQL中replace的用法
2021-09-09
MySql
SQL中Merge的用法
2021-11-08
SQL

04-3 pandas 中 pd.Categorical用法

相關文章