機器學習之分類：準確率

準確率是一個用於評估分類模型的指標。通俗來說，準確率是指我們的模型預測準確的結果所佔的比例。正式點說，準確率的定義如下：

Accuracy = \dfrac{Number of correct predictions}{Total number of predictions}

對於二元分類，也可以根據正類別和負類別按如下方式計算準確率：

Accuracy = \dfrac{TP + TN}{TP + TN + FP + FN}

其中，TP = 真正例，FP = 假正例，FN = 假負例。
讓我們來試著計算一下以下模型的準確率，該模型將 100 個腫瘤分為惡性（正類別）或良性（負類別）：

Accuracy = \dfrac{TP + TN}{TP + TN + FP + FN} \\= \dfrac{1 + 90}{1 + 90 + 1 + 8} = 0.91

準確率為 0.91，即 91% （總共 100 個樣本中有 91 個預測正確）。這表示我們的腫瘤分類器在識別惡性腫瘤方面變現的非常出色，對吧？
實際上，只要我們仔細分析一下正類別和負類別，就可以更好地瞭解我們模型的效果。
在 100 個腫瘤樣本中，91 個為良性（90個 TN 和 1 個 FP），9 個為惡性（1個 TP 和 8 個FN）。
在 91 個良性腫瘤中，該模型將 90 個正確識別為良性。這很好。不過，在 9 個惡性腫瘤中，該模型僅將一個正確識別為惡性。這是多麼可怕的結果！9 個惡性腫瘤中有 8 個未被診斷出來！
雖然 91% 的準確率可能乍一看還不錯，但如果另一個腫瘤分類器模型總是預測良性，那麼這個模型使用我們的樣本進行預測也會實現相同的準確率（100 箇中有 91 個預測正確）。換言之，我們的模型與那些沒有預測能力來區分惡性腫瘤和良性腫瘤的模型差不多。
當您使用分類不平衡的資料集（比如正類別標籤和負類別標籤的數量之間存在明顯差異）時，單單準確率一項並不能反映全面情況。
在下一部分中，我們將介紹兩個能夠更好地評估分類不平衡問題的指標：精確率和召回率。

本作品採用《CC 協議》，轉載必須註明作者和本文連結

Hacking

機器學習之分類：精確率和召回率
2020-06-27
機器學習
機器學習系列之分類
2018-04-03
機器學習
機器學習之分類問題度量
2020-02-14
機器學習
機器學習之分類：指定閾值
2020-06-21
機器學習
機器學習之分類：預測偏差
2020-06-28
機器學習
【火爐煉AI】機器學習011-分類模型的評估：準確率，精確率，召回率，F1值
2018-08-06
AI機器學習模型
機器學習之分類：ROC 和曲線下面積
2020-06-28
機器學習
準確率達 95%，機器學習預測複雜新材料合成
2021-12-30
機器學習
機器學習之分類迴歸樹(python實現CART)
2018-03-04
機器學習Python
機器學習之分類：真與假以及正類別與負類別
2020-06-21
機器學習
準確率達100%，「人機互動」機器學習，驅動有機反應精確原子對映研究
2024-04-03
機器學習
【機器學習】什麼樣的機器學習產品是最符合使用者需求的；機器學習模型的衡量不止準確率：還有精度和召回率
2018-03-26
機器學習模型
機器學習診斷準確率高達90%，讓這種疾病無處可逃
2019-04-01
機器學習
AI預測心力衰竭，準確率竟100%！網友：門外漢濫用機器學習
2019-10-21
AI機器學習
準確率（Accuracy）精確率（Prescision）召回率（Recall）
2018-06-15
精確率、召回率、準確率與ROC曲線
2018-05-15
分類準確率達99%，山大團隊提出基於對比學習的基因資料分類方法
2024-10-31
機器學習在提升持續整合構建準確性和召回率的應用和思考 - 楊碩
2020-06-11
機器學習
一文詳解機器學習的判別指標(精準率，召回率)
2021-06-30
機器學習指標
機器學習入門準備
2018-04-10
機器學習
【機器學習】支援向量機分類
2022-07-13
機器學習
機器學習——dbscan密度聚類
2020-11-19
機器學習聚類
機器學習（8）——其他聚類
2018-03-24
機器學習聚類
機器學習-學習率：從理論到實戰，探索學習率的調整策略
2023-12-05
機器學習
準確率評價指標
2020-10-05
指標
混淆矩陣、準確率、精確率/查準率、召回率/查全率、F1值、ROC曲線的AUC值
2018-07-09
矩陣
機器學習筆記——特徵標準化
2018-10-24
機器學習筆記特徵
谷歌ReCaptcha系統被破解機器語音驗證準確率高達85%
2019-01-03
谷歌APT
機器學習-聚類分析之DBSCAN
2020-11-22
機器學習聚類
機器學習之層次聚類
2020-04-14
機器學習聚類
機器學習常用的分類器比較
2018-04-02
機器學習
從零開始學機器學習——初探分類器
2024-10-15
機器學習
準確率達95%，混合深度學習搜尋奈米生物材料，登Nature子刊
2024-12-12
深度學習
機器學習之邏輯迴歸：計算機率
2020-06-21
機器學習邏輯迴歸計算機
【機器學習】資料準備--python爬蟲
2022-06-22
機器學習Python爬蟲
機器學習（四）：4層BP神經網路（只用numpy不調包）用於訓練鳶尾花資料集|準確率96%
2023-04-08
機器學習神經網路
瞭解機率知識，機率作為機器學習的底層邏輯
2020-06-24
機器學習
從零開始學機器學習——分類器詳解
2024-10-16
機器學習

機器學習之分類：準確率

相關文章