分類任務中效能度量及程式碼

希望每天漲粉發表於2021-12-05

原文網址 : https://www.cnblogs.com/BlairGrowing/p/15646116.html

樣本

　　正樣本：即屬於某一類（一般是所求的那一類）的樣本。在本例中是及格的學生。
　　負樣本：即不屬於這一類的樣本。在本例中是不及格的學生。

　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]

　　上述 0 代表不及格，1 代表及格。這裡正樣本代表及格。

TP、FP、FN、TN

	正類	負類
被檢索	True Positive	False Positive
未檢索	False Negative	True Negative

TP：被檢索到正樣本，實際也是正樣本（正確識別）

　　　　在本例表現為：預測及格，實際也及格。本例 TP=2

FP：被檢索到正樣本，實際是負樣本（一類錯誤識別）

　　　　在本例表現為：預測及格，實際不及格。本例 FP=2

FN：未被檢索到正樣本，實際是正樣本。（二類錯誤識別）

　　　　在本例表現為：預測不及格，實際及格了。本例 FN=2

TN：未被檢索到正樣本，實際也是負樣本。（正確識別）

　　　　在本例表現為：預測不及格，實際也不及格。本例 TN=4

程式碼：

from sklearn.metrics import confusion_matrix
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
TN, FP, FN, TP = confusion_matrix(y_true, y_pred).ravel()
print(TN, FP, FN, TP)

結果：4 2 2 2

Accuracy（準確率、精度）

　　　　$\operatorname{acc}(f ; D) =\frac{1}{m} \sum \limits _{i=1}^{m} \mathbb{I}\left(f\left(\boldsymbol{x}_{i}\right)=y_{i}\right) =1-E(f ; D)$

　　　　$A C C=\frac{T P+T N}{T P+T N+F P+F N}$

　　分類正確的樣本數與樣本總數之比。

　　在本例中，

　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1] 　　

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]

　　正確分類了6人（及格2人 + 不及格4人），所以 Accuracy = 6 / 10 = 60%.

程式碼：

from sklearn.metrics import accuracy_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
print(accuracy_score(y_true, y_pred))

結果：

0.6

Precision（精確率、查準率）

　　　　$P=\frac{T P}{T P+F P}$

　　被正確檢索的樣本數與被檢索到樣本總數之比。

　　在本例中，

　　y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]

- 不及格類：檢索到 6人，正確檢索 4人，所以Precision = 4 / 6 = 0.6667.
- 及格類：檢索到 4 人，正確檢索 2人，所以Precision = 2 / 4 = 0.5.

程式碼：

from sklearn.metrics import precision_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 0, 0, 0, 1, 1, 1, 1]
print(precision_score(y_true, y_pred, average=None))  #4/6   2/4

結果：

[0.66666667 0.5 ]

Recall （召回率、查全率）

　　　　$P=\frac{T P}{T P+F P}$

　　被正確檢索 (y_pred) 的樣本數與 應當被檢索 (y_true) 到的樣本數之比。（這裡暫時先不適應上述相同樣本資料，否則和Precision結果一樣，怕搞混）

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
　　y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]

　　在本例中，

- 不及格類：應當檢索到 6人，正確檢索 3人，所以 Recall = 3 / 6 = 0.5.
- 及格類：應當檢索到 4 人，正確檢索 3人，所以 Recall = 3 / 4 = 0.75.

結果：

[0.5 0.75]

F1 Score

　　　　$F 1=\frac{2 \times P \times R}{P+R}$

　　在本例中，

　　y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
　　y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]

- 不及格類：P=3/4， R=3/6
- 及格類：P=3/6， R=3/4

程式碼：

from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average=None))
print(recall_score(y_true, y_pred, average=None))
print( f1_score(y_true, y_pred, average=None ))
# 不及格類
p=3/4
r=3/6
print((2*p*r)/(p+r))
# 及格類
p=3/6
r=3/4
print((2*p*r)/(p+r))

結果：

[0.75 0.5 ]
[0.5 0.75]
[0.6 0.6]
0.6
0.6

巨集平均

　　是先對每一個類統計指標值，然後在對所有類求算術平均值。

　　　　$macro-P =\frac{1}{n} \sum \limits _{i=1}^{n} P_{i}$

　　　　$macro -R =\frac{1}{n} \sum \limits _{i=1}^{n} R_{i}$

　　　　$macro -F1 =\frac{2 \times macro-P \times macro-R}{macro-P+macro-R}$

程式碼：

from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 0, 0, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 0, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average=None))
print(recall_score(y_true, y_pred, average=None))
print(precision_score(y_true, y_pred, average="macro"))
print(recall_score(y_true, y_pred, average="macro"))
print(f1_score(y_true, y_pred, average="macro"))

結果：

[0.75 0.5 ]
[0.5 0.75]
0.625
0.625
0.6

微平均

　　是對資料集中的每一個例項不分類別進行統計建立全域性混淆矩陣，然後計算相應指標。

　　　　$micro-P=\frac{\overline{T P}}{\overline{T P}+\overline{F P}} $

　　　　$micro-R=\frac{\overline{T P}}{\overline{T P}+\overline{F N}} $

　　　　$micro-F 1=\frac{2 \times micro-P \times micro-R}{ micro-P+\text { micro }-R}$

　　看成一類，造成的結果是 $micro-P = micro-R $。

程式碼：

from sklearn.metrics import recall_score,precision_score,f1_score
y_true = [0, 2, 2, 0, 1, 1, 1, 1, 0, 0]
y_pred = [0, 0, 2, 1, 1, 1, 1, 0, 1, 1]
print(precision_score(y_true, y_pred, average="micro"))
print(recall_score(y_true, y_pred, average="micro"))
print(f1_score(y_true, y_pred, average="micro"))

結果：

0.5
0.5
0.5

混淆矩陣

　　第 $i$ 行代表第 $i$-th class，每列表示把 $i$-th class 分配到 $j$-th class 中的個數

程式碼：

from sklearn.metrics import confusion_matrix
y_true = [1, 1, 1, 2, 2, 3]
y_pred = [1, 1, 2, 1, 2, 3]
print(confusion_matrix(y_true, y_pred))

結果：

[[2 1 0]

[1 1 0]

[0 0 1]]

程式碼：

y_true = ["cat", "ant", "cat", "cat", "ant", "bird"]
y_pred = ["ant", "ant", "cat", "cat", "ant", "cat"]
print(confusion_matrix(y_true, y_pred, labels=["ant", "bird", "cat"]))

結果：

[[2 0 0]

[0 0 1]

[1 0 2]]

分類報告

　　將上述結果，用report的形式展示出來

程式碼：

from sklearn.metrics import classification_report
y_true = [0, 1, 2, 2, 0]
y_pred = [0, 0, 2, 2, 0]
target_names = ['class 0', 'class 1', 'class 2']
print(classification_report(y_true, y_pred, target_names=target_names))

結果：

真正率、假正率

　　真正率 (TPR ) = 靈敏度/召回率 =

P-R曲線

若一個學習演算法的PR曲線被另一個學習演算法的曲線完全“包住”，則可認為後者的效能優於前者，如A優於C；
若兩個學習演算法的PR曲線發生交叉（如A和B），則難以判斷孰優孰劣，只能在具體的查準率和查全率條件下進行比較；
- 可通過比較P-R曲線下的面積（PR-AUC）
- 利用平衡點（即P=R時的取值）
- 利用F1度量

ROC

AUC

代價敏感錯誤率

略

『總結不易，加個關注唄！』

深度學習 | 分類任務中類別不均衡解決策略（附程式碼）
2019-01-14
深度學習
分類任務loss不變
2020-11-27
分類任務中的樣本不均衡問題
2020-10-07
效能度量
2021-12-02
Linux系統中延時任務及定時任務
2020-12-15
Linux
圖結構的相似度度量與分類
2019-04-22
計算機視覺經典任務分類
2018-05-28
計算機視覺
bert分類的程式碼
2024-06-21
程式與計劃任務管理（at 及 crontab）
2020-11-02
淺談NLP 文字分類/情感分析任務中的文字預處理工作
2020-10-22
文字分類
如何有效度量前端效能
2023-02-10
前端
網路配置及程序-系統效能和計劃任務
2024-11-18
CNN也能用於NLP任務，一文簡述文字分類任務的7個模型
2018-07-04
CNN文字分類模型
AsyncTask非同步任務類
2019-01-19
非同步
程式設計師垃圾程式碼分類指南
2019-07-25
程式設計師
機器學習中的效能度量指標彙總
2018-09-09
機器學習指標
詳解JavaScript的任務、微任務、佇列以及程式碼執行順序
2019-07-25
JavaScript佇列
tensorflow 學習筆記使用CNN做英文文字分類任務
2020-10-24
筆記CNN文字分類
如何用機器學習處理二元分類任務？
2019-03-04
機器學習
Quartz 定時任務管理類
2021-09-17
quartz
機器學習(三)：理解邏輯迴歸及二分類、多分類程式碼實踐
2021-02-01
機器學習邏輯迴歸
js中的巨集任務和微任務
2020-12-07
JS
Collections工具類,可以使用collections工具類對程式碼中的list進行分組
2024-03-23
Java中，類與類，類中的程式碼執行順序
2018-12-10
Java
聊聊效能度量的作弊經濟學
2024-11-18
研發效能度量引發的血案
2021-10-17
淺談任務分發中的機制與併發
2023-03-21
java Quartz 定時任務管理類
2022-02-21
Javaquartz
springboot Quartz 定時任務工具類
2021-07-02
Spring Bootquartz
win10計劃任務程式庫實現定時任務的自動執行程式及問題解決。
2023-04-03
Win10行程
Tensorflow2 自定義資料集圖片完成圖片分類任務
2020-06-21
Oracle 任務管理之 ----program(程式)---scheduler（計劃）--Job(任務)
2018-06-09
Oracle
Locust 任務指令碼初探
2020-05-11
指令碼
pytorch深度學習分類程式碼簡單示例
2024-08-07
PyTorch深度學習
推送服務本地通知頻次及分類管控通知
2023-09-22
jenkins中maven的安裝及配置，如何在jenkins中建立maven任務。
2022-05-27
JenkinsMaven
使用pytorch快速搭建神經網路實現二分類任務（包含示例）
2020-08-03
PyTorch神經網路
懸賞任務小程式原始碼（開源php系統）
2022-05-05
原始碼PHP

分類任務中效能度量及程式碼

TP、FP、FN、TN

Accuracy（準確率、精度）

Precision（精確率、查準率）

Recall （召回率、查全率）

F1 Score

巨集平均

微平均

混淆矩陣

真正率、假正率

P-R曲線

相關文章