機器學習中的效能度量指標彙總

weixin_33935777發表於2018-09-09

Class Content
layout post
title 機器學習中的效能度量指標彙總
categories Blog
description 對機器學習中常用的度量模型的指標進行彙總,並對其附上程式碼便於以後使用
keywords 錯誤率和精度、查準率、查全率、F值、ROC和AUC

前言

在機器學習中要考察選擇模型的優劣,需要對模型的泛化能力進行評估,這就是效能度量。本篇文章主要介紹分類、迴歸以及聚類中的效能度量以及編寫程式碼以便於以後使用。

分類任務常用的效能度量

  • 1. 錯誤率和精度
    顧名思義,錯誤率是指分類錯誤的樣本佔總樣本的比例,精度則是分類正確的樣本佔樣本總數的比例
    錯誤率表示為:精度表示為:其中為指示函式,滿足要求則為1,不滿足為0,且
    更一般的,對於資料分佈和概率密度
    錯誤率表示為:精度表示為:
    實現程式碼:

  • 2. 召回率Recall、準確率Precision、F值
    單純靠錯誤率和精度衡量模型的是遠遠不夠的,在分類中常用Recall、Precision以及F值去度量模型,如下圖二分類混淆矩陣,將召回率和準確率以及F值定義如下:

    5274272-95cfdeff712442df.png
    圖1. 二分類混淆矩陣

    Precision表示為:
    Recall表示為:
    F值是召回率和準確率的調和平均值,表示為:即F值表示為:

未完待續

相關文章