評價指標F-Measure

Kelfvin發表於2024-08-15

衡量二分類模型精度的一種指標,兼顧了分類模型的精確率(precision)和召回率(recall)。是精確率和召回率的調和平均數,最大為 1,最小為 0

precision & recall

二分類問題分類的結果有下面的幾種情況:

預測\真實 正例 反例
正例 預測正確(True Positive 錯誤的將其他類預測為本類(False Positive
反例 本類標籤預測成其他類(False Nagtive 預測反例正確(True Negative

上面的各種預測情況可以簡寫成

\[TP+FP+TN+FN = 樣例總數 \]

有兩個重要的衡量指標,分別是:

  1. precision:又叫精準度/查準度,指分類器預測為正例中分類正確的比例

\[{precision}_{k} = \frac{TP}{TP + FP} \]

  1. recall:召回率/查全率,被預測為正例的樣本佔真實正例的比重

\[\text{recall} = \frac{TP}{TP+FN} \]

  1. accuracy

\[\text{accuracy} = \frac{預測正確數量}{樣本總數量} = \frac{TP+TN}{TP+TN+FP+FN} \]

為什麼需要 F-Measure

一般來說,查準率高是,查全率往往偏低;而查全率高時,查準率往往偏低(要使查準率高,最容易的事情就是將所有的樣本都判定為正類,那就會誤報很多)。\(F-Measure\) 可以在查準率和查全率之間取得一個平衡。

\[F_{\beta} = (1+\beta) \cdot \frac{precision \cdot recall}{\beta^2 precision + recall} \]

\(\beta\) 代表 precision 的重要程度是 recall 的 \(\beta\) 倍。

\(\beta = 1\) 時,就得到了 \(F_{1}\)

\[F_{1}=2\cdot\frac{p r e cisi o n\cdot r e c a l l}{p r e cisi o n+r e c a l l} \]

應用

  • [[IMDL中的F-Measure]]

參考資料

  • F1 score F1分數 - 知乎

相關文章