Python中Pandas 方法cut簡單講講

張國平發表於2018-06-29
 

Pandas.cut 方法作用,剛剛接觸pandas.cut方法時候一臉懵逼,這個到底是幹什麼的呢,輸出也是很奇怪的複合內容。後來做了個下面兩個小測試大概明白了。

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

網上查到的解釋太玄幻,簡單理解,主要作用就是把一個數(x),按照給定的評判組(bins)進行分類,確定這個數屬於那個組,就返回,如果定義判斷組的名字(labels),就按照名字返回。

 

比如有一組考生成績,不直接給出成交,而是按照描述給定;那麼評判組bins0-60是一組,60-80是一組,80-100是一組,描述labels0-60分屬於不及格,60-80是及格,80-100是優秀。

那麼就是如下


點選(此處)摺疊或開啟

  1. import numpy as np

  2. import pandas as pd

  3. grade = [80,75,32.5,100]

  4. bins = [0,60,80,100]

  5. group_names = ['不及格','及格','優秀']

  6. cats = pd.cut(grade, bins,labels = group_names)

 

輸出:

[及格, 及格, 不及格, 優秀]

Categories (3, object): [不及格 < 及格 < 優秀]

第一個是我們要的,後面兩個是附加說明評判組的定義。如果我們想返回原來判定標準, retbins=True即可。最後要注意的輸入的資料x必須是佇列或者numpy.array型別

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/22259926/viewspace-2157078/,如需轉載,請註明出處,否則將追究法律責任。

相關文章