0. 分位數(quantiles)
因為累計分佈函式(cdf,F−1)是單調增函式,因此其有反函式,不妨記為 F−1。
其真實的含義在於,如果 F 是 X 的 cdf,則 F−1(α) 的函式值為:
P(X≤xα)=α
這稱為 α-分位;
F−1 的自變數是概率,
1. Z-score(standard score)
Z-score 指示的是一個到均值的距離(可正可負)是多少個標準差(標註差和均值的單位是一致的)。
z=x−μσ
2. F-score
】(significance test)。
在二分類(binary classification,當然也可從多分類任務輕鬆轉換為二分類問題,One-vs.-rest)問題的統計分析中,F1 score(也叫 F-score 或者 F-measure),其是對測試時準確度的一種度量。其定義式如下:
F1=2⋅11precision+1recall=2⋅precision⋅recallprecision+recall
- precision:表示精確率,p=tptp+fp
- recall:則表示回召率,r=fpfp+tn=fpn
關於調和平均(harmonic mean):
H=11n∑i=1n1xi=n∑i=1n1xi
進一步將其擴充泛化為加權調和平均:
H=11∑i=1nmi⋅∑i=1nmixi=∑i=1nmi∑i=1nmixi