二分類問題中混淆矩陣、PR以及AP評估指標

快到皖裡來發表於2021-02-18

原文網址 : https://www.cnblogs.com/pythonfl/p/14411257.html

仿照上篇博文對於混淆矩陣、ROC和AUC指標的探討，本文簡要討論機器學習二分類問題中的混淆矩陣、PR以及AP評估指標；實際上，（ROC,AUC）與（PR,AP）指標對具有某種相似性。

按照循序漸進的原則，依次討論混淆矩陣、PR和AP：

設定一個機器學習問題情境：給定一些腫瘤患者樣本，構建一個分類模型來預測腫瘤是良性還是惡性，顯然這是一個二分類問題。
本文中，將良性腫瘤視為正類標籤（可能在具體實踐中更為關注惡性腫瘤，不過這並不影響技術上的操作）。
當分類模型選定以後，將其在測試資料集上進行評估，分別可以得到以下評估指標：

混淆矩陣

TP表示預測為良性，真實情況是良性的樣例數；
FN表示預測為惡性，真實情況是良性的樣例數；
FP表示預測為良性，真實情況是惡性的樣例數；
TN表示預測為惡性，真實情況是惡性的樣例數；
以上四類資料構成混淆矩陣。

PR

在混淆矩陣的基礎上，進一步地定義兩個指標。

按照下式定義precision（P）指標

precision表示，預測為正的樣本中有多少是真正的正樣本；精準率強調對某類樣本識別的準確性。

按照下式定義recall（R）指標

recall表示，樣本中的正例有多少被預測正確了；召回率強調對某類樣本識別的全面性。

precision,recall分別反映分類器對某一類樣本鑑別能力的兩個方面；通常，這兩個指標呈現互斥關係，即一個指標高了往往會致使另一指標降低。

由上，一個混淆矩陣對應一對（precision,recall）

需要明確的是，P和R是建立在類別明確的預測結果之上的，即分類模型明確地指出待預測樣本的類別。
然而，在二分類問題（0，1）中，一般模型最後的輸出是一個概率值，表示結果是1的概率。此時需要確定一個閾值，若模型的輸出概率超過閾值，則歸類為1；若模型的輸出概率低於閾值，則歸類為0。
不同的閾值會導致分類的結果不同，也就是混淆矩陣有差，P和R也就不同。
當閾值從0開始慢慢移動到1的過程，就會形成很多對（precision,recall）的值，將它們畫在座標系上，就是所謂的PR曲線了。

AP

得到PR曲線後，就可以計算曲線下方的面積，計算出來的面積就是AP值。
一般而言，AP越大，模型的效能越好。

示例

評估指標與評分（上）：二分類指標
2022-05-28
指標
【機器學習】--模型評估指標之混淆矩陣，ROC曲線和AUC面積
2018-03-27
機器學習模型指標矩陣
二分類問題常見的評價指標
2019-03-07
指標
分類演算法的評估指標
2020-04-06
演算法指標
1434: 矩陣的最大值（指標專題）
2020-11-24
矩陣指標
迴歸模型-評估指標
2018-06-02
模型指標
opencv-9-影像噪聲以及評估指標 PSNR 與SSIM
2020-05-01
OpenCV指標
指標-矩陣下三角元素之和
2019-03-16
指標矩陣
【推薦系統】評估指標總結
2018-05-01
指標
工程團隊的10大評估指標
2022-11-23
指標
C----陣列越界問題、指標入門
2018-10-18
陣列指標
關於二維陣列指標的問題
2018-10-17
陣列指標
陣列指標，指標陣列
2018-08-04
陣列指標
六種GAN評估指標的綜合評估實驗，邁向定量評估GAN的重要一步
2018-07-02
指標
矩陣空間採用 new 動態申請，儲存在指標中
2021-10-26
矩陣指標
一文詳盡系列之模型評估指標
2020-02-15
模型指標
機器學習筆記之效能評估指標
2018-04-25
機器學習筆記指標
python實現多分類評價指標
2020-09-20
Python指標
指標陣列與陣列指標
2020-10-02
指標陣列
邏輯迴歸求解二分類問題以及SPSS的實現
2024-07-03
邏輯迴歸SPSS
動手畫混淆矩陣(Confusion Matrix)（含程式碼）
2022-08-10
矩陣
雙指標查詢陣列的連續規律子陣列問題
2018-07-19
指標陣列
Go 陣列指標(指向陣列的指標)
2019-03-20
Go陣列指標
矩陣指數的定義
2024-07-30
矩陣
語音識別 (ASR) 模型測試之評估指標探索
2020-12-22
模型指標
指標陣列和陣列指標與二維陣列
2024-04-13
指標陣列
二分查詢的迴圈條件及指標終止位置問題
2024-07-09
指標
陣列指標
2018-06-08
陣列指標
劍指offer：JZ12 矩陣中的路徑
2021-10-25
矩陣
劍指offer面試題29：順時針列印矩陣
2020-10-14
面試題矩陣
有關this指標指向問題
2018-09-02
指標
流量渠道資料分析方法與價值評估指標體系
2024-01-15
指標
評估智慧對話機器人的7大資料指標
2020-09-24
機器人大資料指標
演算法金 | 必會的機器學習評估指標
2024-06-28
演算法機器學習指標
直擊RSAC 2022：如何綜合評估威脅情報指標
2022-06-14
指標
目標檢測模型的評價標準-AP與mAP
2022-12-02
模型
矩陣連乘問題 Python 動態規劃
2021-04-27
矩陣Python動態規劃
C語言指標(三)：陣列指標和字串指標
2020-11-18
C語言指標陣列字串