深入理解F1-score

Hisi發表於2022-02-03

本部落格的截圖均來自zeya的post:Essential Things You Need to Know About F1-Score | by Zeya | Towards Data Science

 

F1-score的定義:準確率(precision)和召回率(recall)的調和平均(harmonic mean)

 

 

 

  這裡主要理解一下為什麼使用調和平均,從“調和”這個詞出發也可以知道,調和平均可以使得recall和precision之間的差距較小,否則F1會很小,這個很小的幅度比幾何平均、算數平均來的還要快,以下是三種平均值的定義:

 

 

 按照zeya的說法,如果我們谷歌搜為什麼F1分數使用調和平均,則會得到類似“調和平均會懲罰不相等的數對懲罰的更厲害”(harmonic mean penalises unequal values more)和“調和平均會懲罰極值”(harmonic mean punishes extreme values),具體理解調和平均相對於另外兩種平均的優勢可以看下圖:

 

此網址是上圖的動態圖:Online Graph Maker · Plotly Chart Studio

平面的兩個座標軸是召回率和準確率,紫色的點是調和平均的值,綠色的點是幾何平均的值,紅色的點是算數平均的值,讓我們來看坐下角的值:

 

 

 

 

 

 

從上圖我們可以知道,對於相同的(precision=1,recall=0.05)數對,紫色的調和平均給的分數最低,也就是懲罰這種不平均、不平衡或是有極值的(準確率,召回率)數對懲罰的最厲害,從整體上看,紫色的最彎曲,意味著對於相同的(precision,recall)座標,調和平均的分數不會比其他兩種高。