衡量二分類模型精度的一種指標,兼顧了分類模型的精確率(precision)和召回率(recall)。是精確率和召回率的調和平均數,最大為 1,最小為 0
precision & recall
二分類問題分類的結果有下面的幾種情況:
預測\真實 | 正例 | 反例 |
---|---|---|
正例 | 預測正確(True Positive) | 錯誤的將其他類預測為本類(False Positive) |
反例 | 本類標籤預測成其他類(False Nagtive) | 預測反例正確(True Negative) |
上面的各種預測情況可以簡寫成
\[TP+FP+TN+FN = 樣例總數
\]
有兩個重要的衡量指標,分別是:
- precision:又叫精準度/查準度,指分類器預測為正例中分類正確的比例
\[{precision}_{k} = \frac{TP}{TP + FP}
\]
- recall:召回率/查全率,被預測為正例的樣本佔真實正例的比重
\[\text{recall} = \frac{TP}{TP+FN}
\]
- accuracy
\[\text{accuracy} = \frac{預測正確數量}{樣本總數量} = \frac{TP+TN}{TP+TN+FP+FN}
\]
為什麼需要 F-Measure
一般來說,查準率高是,查全率往往偏低;而查全率高時,查準率往往偏低(要使查準率高,最容易的事情就是將所有的樣本都判定為正類,那就會誤報很多)。\(F-Measure\) 可以在查準率和查全率之間取得一個平衡。
\[F_{\beta} = (1+\beta) \cdot \frac{precision \cdot recall}{\beta^2 precision + recall}
\]
\(\beta\) 代表 precision 的重要程度是 recall 的 \(\beta\) 倍。
當 \(\beta = 1\) 時,就得到了 \(F_{1}\)。
\[F_{1}=2\cdot\frac{p r e cisi o n\cdot r e c a l l}{p r e cisi o n+r e c a l l}
\]
應用
- [[IMDL中的F-Measure]]
參考資料
- F1 score F1分數 - 知乎