使用ClassificationThresholdTuner進行二元和多類分類問題閾值調整,提高模型效能增強結果可解釋性

deephub發表於2024-09-12

AUROC 指標,顧名思義,是基於 ROC 的,ROC 是一條顯示真陽性率與假陽性率關係的曲線。ROC 曲線本身並不假設使用任何特定的閾值。但是曲線上的每個點對應一個特定的閾值。

在下面的圖中,藍色曲線是 ROC。這條曲線下的面積(AUROC)衡量了模型的總體效能,是在所有潛在閾值上的平均值。它衡量機率的排名質量:如果機率排名良好,那麼被分配更高正類預測機率的記錄實際上更可能屬於正類。

例如,AUROC 為 0.95 意味著隨機選擇的正樣本有 95% 的機會比隨機選擇的負樣本獲得更高的排名。

擁有一個 AUROC 強大的模型很重要 — 這是模型調優過程的目標(儘管實際上可能會最佳化其他指標)。這是在我們開始調整閾值之前完成的。

https://avoid.overfit.cn/post/2d3a3a2c95e2468a8ccf52297d0e8bf8

相關文章