高偏差、高方差、低精確率與低召回率、混淆矩陣
本文是個人理解
1.高偏差(high bias)與方差(high variance)
偏差,可以理解為樣本與模型預測結果的差距,可以使用平方差計算
方差是樣本y值與模型期望的差的平方和。
模型對實驗資料欠擬合(underfitting) 是會出現搞偏差,而過擬合(overfitting)會造成高方差
解決方法:直接的方法是將實驗資料一分為二:訓練集和測試集。模型在訓練集和測試集上都達到高正確率才說明偏差和方差都可以接受
增加體徵的數量可以降低偏差;減少特徵數量可以降低方差
2. 精確率(precision)與召回率(recall)
, '真正' 與 '真負'總和中'真正'的比例。
, 即 '真正' 與'假負'總和中真正的比例
以新聞推薦舉例。
精確率可以理解為,所有推薦了的新聞中該推薦的新聞的比例。 比如,推薦了10篇新聞,其中8篇是應該推薦的
召回率可以理解為,所有應該推薦的新聞中實際推薦了的新聞的比例。比如應該推薦10篇感興趣的新聞,只推薦了其中的8篇。
要平衡精確率和召回率,可以調節區分正負類別的概率臨界值。 為提高精確率,可以提高概率臨界值,使得正類別的判斷更加
保守;為了提高召回率,可以降低概率臨界值,以增加正類別的數量
3. 混淆矩陣
在機器學習(人工智慧領域),混淆矩陣(confusionmatrix)是可視化工具,特別用於監督學習,在無監督學習一般叫做匹配矩陣。矩陣的列表示預測類的例項,行表示實際類的例項,這樣通過混淆矩陣的一些指標可以衡量演算法的精度。
AC(Accuracy)=(a+d)/(a+b+c+d)
TP(recall or true
positive rate) =
d/(c+d)
FP(false
positive rate) =
b/(a+b)
TN (true
negative rate)=
a/(a+b)
FN(false
negative rate) =
c/(c+d)
P(precision ) =
d/(b+d)
|
相關文章
- 混淆矩陣、準確率、精確率/查準率、召回率/查全率、F1值、ROC曲線的AUC值矩陣
- 機器學習之分類:精確率和召回率機器學習
- 高+低
- 市銷率計算公式是什麼 股票市銷率高好還是低好公式
- 高除低
- 【火爐煉AI】機器學習011-分類模型的評估:準確率,精確率,召回率,F1值AI機器學習模型
- 股票收益率的協方差矩陣算出來有什麼用矩陣
- 銀彈谷:企業使用低程式碼存在預期過高的偏差
- 混淆矩陣矩陣
- [白話解析] 通過例項來梳理概念 :準確率 (Accuracy)、精準率(Precision)、召回率(Recall)和F值(F-Measure)
- 一文詳解機器學習的判別指標(精準率,召回率)機器學習指標
- 整合學習-偏差與方差
- AI質檢優化實踐:召回率和準確率,哪個更重要?AI優化
- 均值、方差、協方差、協方差矩陣、特徵值、特徵向量矩陣特徵
- AI質檢最佳化實踐:召回率和準確率,哪個更重要?AI
- 基於勝率矩陣的PageRank排序矩陣排序
- CPU使用率低負載高負載
- 軟體工程-----高內聚低耦合軟體工程
- 協方差矩陣推導1矩陣
- 【小程式踩坑】小程式頁面pv統計數過高,導致頁面轉化率低
- 演算法金 | 協方差、方差、標準差、協方差矩陣演算法矩陣
- 蘇姿豐確認 RX 7000 顯示卡帶來新功能,支援高解析度、高幀率遊戲遊戲
- 懷孕超過六週香港抽血檢測bb男女準確率就會低嗎?
- 機率論12 矩與矩生成函式函式
- 吳恩達機器學習系列14:偏差與方差吳恩達機器學習
- 機率論11 協方差與相關係數
- ORACLE CPU佔率高的程式Oracle
- 高內聚,低耦合的實現方式
- 樣本協方差矩陣的定義與計算矩陣
- 協方差矩陣概念及計算矩陣
- x->0時,高階+低階等價於低階?為什麼
- 【小程式踩坑系列4】小程式頁面pv統計數過高,導致頁面轉化率低
- 方差與偏差的解釋和解決辦法
- cpu使用率低負載高,原因分析負載
- Java 工程解耦即高內聚低耦合Java解耦
- 資料字典快取命中率低怎麼調整。快取
- 迄今最準確方法誕生!AI預測過早死亡風險,準確率高達76%AI
- 高排放行業:低碳供應商的挑戰與機遇行業