機器學習入門(六)——評價分類結果

程研板發表於2020-10-04

一.混淆矩陣

在這裡插入圖片描述

二.精準率和召回率

在這裡插入圖片描述

上圖說明只看準確率是遠遠不夠的。

在這裡插入圖片描述

測試資料：

from sklearn import datasets
from sklearn.model_selection import train_test_split

digits = datasets.load_digits()
X = digits.data
y = digits.target.copy()
 
y[digits.target==9] = 1
y[digits.target!=9] = 0

X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)

邏輯迴歸預測：

from sklearn.linear_model import LogisticRegression
 
log_reg = LogisticRegression()
log_reg.fit(X_train, y_train)
log_reg.score(X_test, y_test)           #0.9755555555555555
y_predict = log_reg.predict(X_test)

在這裡插入圖片描述

三.Precision-Recall的平衡

在這裡插入圖片描述左邊為0，右邊為1，五角星為1，圓圈為0

精準率增大時召回率降低

精準率高，則對特別有把握時才預測對，則以前本該算預測對的，變成不對，召回率就越低

召回率高，降低判斷， 10%的概率也說有病

自定義曲線：

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
 
digits = datasets.load_digits()
X = digits.data
y = digits.target.copy()
 
y[digits.target==9] = 1
y[digits.target!=9] = 0
 
from sklearn.model_selection import train_test_split
 
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=666)
 
from sklearn.linear_model import LogisticRegression
 
log_reg = LogisticRegression()
log_reg.fit(X_train, y_train)
decision_scores = log_reg.decision_function(X_test)
 
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
 
precisions = []
recalls = []
thresholds = np.arange(np.min(decision_scores), np.max(decision_scores), 0.1)
for threshold in thresholds:
    y_predict = np.array(decision_scores >= threshold, dtype='int')
    precisions.append(precision_score(y_test, y_predict))
    recalls.append(recall_score(y_test, y_predict))

在這裡插入圖片描述

使用sklearn中的包：

from sklearn.metrics import precision_recall_curve
precisions,recalls,thresholds = precision_recall_curve(y_test,decision_scores)

在這裡插入圖片描述

橫軸是P，縱軸是R

PR曲線靠外或xy軸的面積大則對應的模型好

四.ROC曲線

在這裡插入圖片描述

五.多分類問題中的混淆矩陣

import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets
 
digits = datasets.load_digits()
X = digits.data
y = digits.target
 
from sklearn.model_selection import train_test_split
 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.8, random_state=666)
 
from sklearn.linear_model import LogisticRegression
 
log_reg = LogisticRegression()
log_reg.fit(X_train, y_train)
log_reg.score(X_test, y_test)

y_predict = log_reg.predict(X_test)

from sklearn.metrics import precision_score
 
precision_score(y_test, y_predict,average='micro')

在這裡插入圖片描述

入門系列之Scikit-learn在Python中構建機器學習分類器
2019-02-27
Python機器學習
機器學習框架ML.NET學習筆記【2】入門之二元分類
2019-05-29
機器學習框架筆記
【機器學習】支援向量機分類
2022-07-13
機器學習
SpringMVC入門學習---結果跳轉方式
2019-05-10
SpringMVC
19、如何使用機器學習結果
2019-02-23
機器學習
機器學習之使用sklearn構建據類模型，並且評價模型
2020-12-31
機器學習模型
機器學習總結（2）—分類中的代數模型
2020-10-24
機器學習模型
機器學習入門準備
2018-04-10
機器學習
機器學習之小白入門
2020-02-27
機器學習
機器學習入門規劃
2020-10-11
機器學習
機器學習PAI快速入門
2019-07-05
機器學習AI
機器學習01-入門
2021-09-22
機器學習
機器學習--有監督學習--分類演算法（預測分類）
2024-06-18
機器學習演算法
機器學習和深度學習概念入門
2018-04-12
機器學習深度學習
gRPC入門學習之旅（六）
2024-04-13
RPC
機器學習常用的分類器比較
2018-04-02
機器學習
[譯] 通過整合學習提高機器學習結果
2019-02-27
機器學習
從零開始學機器學習——初探分類器
2024-10-15
機器學習
如何用機器學習對文字分類
2019-02-20
機器學習文字分類
衝刺結果評分
2024-05-12
聊聊經典機器學習入門
2024-08-08
機器學習
從零開始學機器學習——分類器詳解
2024-10-16
機器學習
【乾貨】機器學習和深度學習概念入門
2018-12-31
機器學習深度學習
機器學習--分類變數編碼方法
2020-10-01
機器學習變數
機器學習3-分類演算法
2021-01-18
機器學習演算法
機器學習十講-第三講分類
2021-02-08
機器學習
JVM學習-虛擬機器類載入機制
2018-12-10
JVM虛擬機
機器學習入門實戰疑問
2020-04-30
機器學習
機器學習入門之sklearn介紹
2019-03-05
機器學習
Java虛擬機器（六）：類載入機制
2018-12-09
Java虛擬機
從零開始學機器學習——入門NLP
2024-11-21
機器學習
【機器學習】帶你3分鐘看完《機器學習實戰》總結篇
2018-03-10
機器學習
機器學習之樸素貝葉斯分類
2019-02-28
機器學習
機器學習4-分類演算法2
2021-01-19
機器學習演算法
使用機器學習預測房價(附連結)
2019-04-16
機器學習
不平衡資料的分類評價指標總結
2018-09-26
指標
人工智慧 (02) 機器學習 - 監督式學習分類方法
2019-12-18
人工智慧機器學習
機器學習讀書筆記：貝葉斯分類器
2020-10-05
機器學習筆記

機器學習入門(六)——評價分類結果

目錄

一.混淆矩陣

二.精準率和召回率

三.Precision-Recall的平衡

四.ROC曲線

五.多分類問題中的混淆矩陣

相關文章