機器學習之分類問題度量

Galois發表於2020-02-14

在二分類問題中,下面這些主要度量標準對於評估模型的效能非常重要。

混淆矩陣

混淆矩陣可以用來評估模型的整體效能情況。它的定義如下:
機器學習之分類問題度量

主要度量標準

通常用下面的度量標準來評估分類模型的效能:
| 效能度量 | 公式 | 說明 |
| :————: | :————: | :————: |
|Accuracy|(TP+TN)/(TP+TN+FP+FN)|模型總體行效能|
| Precision | TP/(TP+FP) | 預測為正樣本的準確度 |
| Recall Sensitivity | TP/(TP+FN) | 真正樣本的覆蓋度 |
| Specificity | TP/(TN+FP) |真負樣本的覆蓋度|
| F1 score | 2TP/(2TP+FP+FN) |混合度量,對於不平衡類別非常有效|

ROC
– 受試者工作曲線,又叫做ROC曲線,它使用真正例率和假正例率分別作為縱軸和橫軸並且進過調整閾值繪製出來。下表彙總了這些度量標準:
機器學習之分類問題度量
AUC
受試者工作曲線的之下的部分,又叫做AUC或者AUROC,如下圖所示ROC曲線下的部分:

機器學習之分類問題度量

本作品採用《CC 協議》,轉載必須註明作者和本文連結

不要試圖用百米衝刺的方法完成馬拉松比賽。

相關文章