機器學習之分類問題度量

Galois發表於2020-02-14

在二分類問題中,下面這些主要度量標準對於評估模型的效能非常重要。

混淆矩陣

混淆矩陣可以用來評估模型的整體效能情況。它的定義如下:
jBBBf8Vhkd.png!large

主要度量標準

通常用下面的度量標準來評估分類模型的效能:

3yjubenErs.png!large

ROC
– 受試者工作曲線,又叫做 ROC曲線,它使用真正例率和假正例率分別作為縱軸和橫軸並且進過調整閾值繪製出來。下表彙總了這些度量標準:
aGUUOeKleb.png!large
AUC
受試者工作曲線的之下的部分,又叫做 AUC 或者 AUROC,如下圖所示ROC曲線下的部分:

U4bRUZjICH.png!large

本作品採用《CC 協議》,轉載必須註明作者和本文連結
不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章