機器學習之分類：精確率和召回率

Lois發表於2020-06-27

原文網址 : https://learnku.com/articles/46409?order_by=created_at&

機器學習

精確率

精確率指標嘗試回答以下問題：
在被識別為正類別的樣本中，確實為正類別的比例是多少？
精確率的定義如下：

Precision = \dfrac{TP}{TP + FP}

注意：如果模型的預測結果中沒有假正例，則模型的精確率為 1.0 。
讓我們來計算一下上一部分中用於分析腫瘤的機器學習模型的精確率：

精確率 = \dfrac{TP}{TP + FP} = \dfrac{1}{1 + 1} = 0.5

該模型的精確率為 0.5，也就是說，該模型在預測惡性腫瘤方面的正確率是 50%。

召回率

召回率嘗試回答以下問題：
在所有正類別樣本中，被正確識別為正類別的比例是多少？
從數學角度講，召回率的定義如下：

召回率 = \dfrac{TP}{TP + FN}

注意：如果模型的預測結果中沒有假負例，則模型的召回率為 1.0
讓我們來計算一下腫瘤分類器的召回率：

召回率 = \dfrac{TP}{TP + FN} = \dfrac{1}{1 + 8} = 0.11

該模型的召回率是 0.11，也就是說，該模型能夠正確識別出所有惡性腫瘤的百分比是 11%

精確率和召回率：一場拔河比賽

要全面評估模型的有效性，必須同時檢查精確率和召回率。遺憾的是，精確率和召回率往往是此消彼長的情況。也就是說，提高精確率通常會降低召回率值，反之亦然。
請觀察下圖來了解這一概念，該圖顯示了電子郵件分類模型做出的 30 項預測。分類閾值右側的被歸類為“垃圾郵件”，左側的則被歸類為“非垃圾郵件”。

圖 1.將電子郵件歸類為垃圾郵件或非垃圾郵件

我們根據圖 1 所示的結果來計算精確率和召回率值：

精確率指的是被標記為垃圾郵件的電子郵件中正確分類的電子郵件所佔的百分比，即圖 1 中閾值線右側的綠點所佔的百分比：

Precision = \dfrac{TP}{TP + FP} = \dfrac{8}{8 + 2} = 0.8

召回率指的是實際垃圾郵件中正確分類的電子郵件所佔的百分比，即圖 1 中閾值線右側的綠點所佔的百分比：

Recall = \dfrac{TP}{TP + FN} = \dfrac{8}{8 +3} = 0.73

圖 2 顯示提高分類閾值產生的效果

圖 2.提高分類閾值

假正例數量會減少，但假負例數量會相應地增加。結果，精確率有所提高，而召回率則有所降低：

Precision = \dfrac{TP}{TP + FP} = \dfrac{7}{7 + 1} = 0.88 Recall = \dfrac{TP}{TP + FN}=\dfrac{7}{7 + 4} = 0.64

相反，圖 3 顯示了降低分類閾值（從圖 1 中的初始位置開始）產生的效果。

圖 3.降低分類閾值。

假正例數量會增加，而假負例數量會減少。結果這一次，精確率有所下降，而召回率有所提高：

Precision = \dfrac{TP}{TP + FP} = \dfrac{9}{9 + 3} = 0.75 Recall = \dfrac{TP}{TP + FN} = \dfrac{9}{9 + 2} = 0.82

我們已經根據精確率和召回率指標制定了各種指標。

本作品採用《CC 協議》，轉載必須註明作者和本文連結

Hacking

機器學習之分類：準確率
2020-06-27
機器學習
【火爐煉AI】機器學習011-分類模型的評估：準確率，精確率，召回率，F1值
2018-08-06
AI機器學習模型
準確率（Accuracy）精確率（Prescision）召回率（Recall）
2018-06-15
精確率、召回率、準確率與ROC曲線
2018-05-15
一文詳解機器學習的判別指標(精準率，召回率)
2021-06-30
機器學習指標
【機器學習】什麼樣的機器學習產品是最符合使用者需求的；機器學習模型的衡量不止準確率：還有精度和召回率
2018-03-26
機器學習模型
混淆矩陣、準確率、精確率/查準率、召回率/查全率、F1值、ROC曲線的AUC值
2018-07-09
矩陣
機器學習在提升持續整合構建準確性和召回率的應用和思考 - 楊碩
2020-06-11
機器學習
機器學習系列之分類
2018-04-03
機器學習
[白話解析] 通過例項來梳理概念：準確率 (Accuracy)、精準率(Precision)、召回率(Recall)和F值(F-Measure)
2020-06-20
機器學習之分類問題度量
2020-02-14
機器學習
機器學習之分類：指定閾值
2020-06-21
機器學習
機器學習之分類：預測偏差
2020-06-28
機器學習
AI質檢優化實踐：召回率和準確率，哪個更重要？
2020-03-17
AI優化
準確率達100%，「人機互動」機器學習，驅動有機反應精確原子對映研究
2024-04-03
機器學習
AI質檢最佳化實踐：召回率和準確率，哪個更重要？
2020-03-17
AI
機器學習之分類：ROC 和曲線下面積
2020-06-28
機器學習
準確率達 95%，機器學習預測複雜新材料合成
2021-12-30
機器學習
機器學習-學習率：從理論到實戰，探索學習率的調整策略
2023-12-05
機器學習
機器學習之分類迴歸樹(python實現CART)
2018-03-04
機器學習Python
機器學習之分類：真與假以及正類別與負類別
2020-06-21
機器學習
瞭解機率知識，機率作為機器學習的底層邏輯
2020-06-24
機器學習
精度(precision)，召回率(recall)，map
2020-10-20
機率論學習筆記
2024-09-07
筆記
機器學習中貝葉斯建模和機率程式設計簡介
2024-05-16
機器學習程式設計
機器學習之邏輯迴歸：計算機率
2020-06-21
機器學習邏輯迴歸計算機
機器學習診斷準確率高達90%，讓這種疾病無處可逃
2019-04-01
機器學習
【深度學習】機率論知識複習
2024-06-20
深度學習
期望與機率論學習筆記
2024-08-09
筆記
淺談深度學習中的機率
2022-11-18
深度學習
AI預測心力衰竭，準確率竟100%！網友：門外漢濫用機器學習
2019-10-21
AI機器學習
機率充電器
2024-03-13
【機器學習】機器學習面試乾貨精講
2018-03-29
機器學習面試
分類準確率達99%，山大團隊提出基於對比學習的基因資料分類方法
2024-10-31
Adam和學習率衰減（learning rate decay）
2019-06-28
數學一|概統|一、隨機事件和機率
2024-06-23
隨機事件
機器學習指導催化劑設計，提高反應的產率
2022-05-27
機器學習
談如何正確理解 IP 資料的覆蓋率，兼談正確率～
2020-03-20

機器學習之分類：精確率和召回率

精確率

召回率

精確率和召回率：一場拔河比賽

圖 1.將電子郵件歸類為垃圾郵件或非垃圾郵件

圖 2.提高分類閾值

圖 3.降低分類閾值。

相關文章