二分類問題常見的評價指標

贪心科技發表於2019-03-07

原文網址 : https://www.jiqizhixin.com/articles/2019-03-07-12

一、準確率

準確率是我們常見的評價指標之一，一般定義是，分類正確的樣本數佔總樣本的比例數。

二分類問題常見的評價指標

但是準確率在資料不均衡的資料集上會缺少一定的說服力，比如一個資料集，有990正樣本，10個負樣本，現在模型把樣本全部都預測成正樣本，那麼我們說模型的準確率是99%，這個從計算上看是沒問題，但是當樣本不均衡時，光使用準確率來評價一個模型的好壞是不夠的。

二、精準率和召回率

二分類問題的預測結果可以根據情況分成以下四類：

真正例（True Positive）：預測值為1，真實值為1

假正例（False Positive）：預測值為1，真實值為0

真反例（True Negative）：預測值為0，真實值為0

假反例（False Negative）：預測值為0，真實值為1

構造成結果的混淆矩陣

二分類問題常見的評價指標

精準率又稱查準率：

二分類問題常見的評價指標

召回率又稱查全率：

二分類問題常見的評價指標

精準率可以解釋為，預測為正例的樣本中，有多少是真的正例

召回率可以解釋為，真實的正例的樣本中，有多少被預測出來

F1：精準率和召回率的調和平均

二分類問題常見的評價指標

三、AUC

AUC是另一種評價二分類演算法的指標，被定義為 ROC 曲線下的面積。那什麼是ROC曲線呢？

二分類問題常見的評價指標

ROC曲線的座標，縱座標為真正例率（True Positive Rate,TPR），橫座標為假正例率（False Positive Rate,FPR）

具體定義如下：

二分類問題常見的評價指標

根據模型在ROC座標上的位置，可以判斷模型的效能

二分類問題常見的評價指標

模型1

二分類問題常見的評價指標

模型2

二分類問題常見的評價指標

橫縱座標

二分類問題常見的評價指標

ROC座標上的四個點

（0,1）：所有樣本分類正確

（1,0）：所有樣本分類錯誤

（0,0）：所以樣本都分類為負

（1:1）：所以樣本都分類為正

由上圖可以看出模型2要好於模型1

怎麼畫出AUC曲線呢，首先按照預測值進行排序

二分類問題常見的評價指標

按照預測值大小，依次作為閾值，求解FP rate和TP rate

二分類問題常見的評價指標

按照上圖的資訊可以畫出曲線

二分類問題常見的評價指標

曲線下的面積被稱為AOC

AOC的意義：衡量正樣本排在負樣本前面的能力，這裡的能力更具體一點就是出現的概率。與域值的選取沒有關係。

四、混淆矩陣

對於多分類的相關問題，常用的評價標準是混淆矩陣

如果分成n個類別的話，混淆矩陣的形式是一個二分類問題常見的評價指標的一個矩陣，具體的形式如下

二分類問題常見的評價指標

上圖中每一列代表預測的類別，每一行代表真實的類別的歸屬，第二行cat的總數量為8，表示類cat總共有8個樣本，其中3個分類正確，3個被錯誤的分到了dog，2個被錯誤的分到了robbit。

如果計算cat的準確率計算公式如下

二分類問題常見的評價指標

參考文獻：

1、李航《統計學習方法》清華大學出版社

2、周志華《機器學習》清華大學出版社

3、Confusion matrix

4、sklearn.metrics.confusion_matrix - scikit-learn 0.20.2 documentation

原文來自學員知乎作業：

https://zhuanlan.zhihu.com/p/55324860

AI 模型常見的評價指標彙總
2020-11-24
AI模型指標
評估指標與評分（上）：二分類指標
2022-05-28
指標
C語言指標常見問題
2023-01-05
C語言指標
二分類問題中混淆矩陣、PR以及AP評估指標
2021-02-18
矩陣指標
python實現多分類評價指標
2020-09-20
Python指標
不平衡資料的分類評價指標總結
2018-09-26
指標
準確率評價指標
2020-10-05
指標
評價指標F-Measure
2024-08-15
指標
評價指標（純手寫）
2024-07-29
指標
[譯] Go 程式碼評審常見問題
2018-07-11
Go
計算機效能評價指標
2018-08-28
計算機指標
一文弄懂pytorch搭建網路流程+多分類評價指標
2021-05-16
PyTorch指標
常見指標型別入門
2019-05-10
指標型別
常見問題
2024-12-06
分類演算法的評估指標
2020-04-06
演算法指標
java.lang.NullPointerException 空指標異常問題
2018-05-07
JavaNullException指標
【綜合評價方法】常見綜合評價方法及其實現
2024-08-26
USACO 比賽指導建議和常見問題
2024-11-28
C++ 指標常見用法小結
2018-04-12
C++指標
軟體效能測試常見指標
2022-10-31
指標
常見網際網路分析指標
2021-06-21
指標
推薦系統 TOP K 評價指標
2022-04-24
指標
js常見問題
2019-02-16
JS
Homestead 常見問題
2018-11-23
Apache 常見問題
2018-11-23
Apache
Linux 常見問題
2018-11-23
Linux
Git 常見問題
2018-11-23
Git
PHP 常見問題
2018-11-24
PHP
swiper常見問題
2019-01-28
Composer 常見問題
2018-12-04
HTML常見問題
2018-05-11
HTML
Git常見問題
2018-05-26
Git
前端常見問題
2018-06-13
前端
【Nginx】常見問題
2019-08-12
Nginx
ndk 常見問題
2020-10-22
CSS常見問題
2019-02-17
CSS
nginx 常見問題
2018-12-26
Nginx
Mysql:常見問題
2024-11-06
MySql

二分類問題常見的評價指標

一、準確率

二、精準率和召回率

四、混淆矩陣

相關文章