使用sklearn實現svm--用於機械故障分類

清新的改革之風發表於2020-11-06

原文網址 : https://blog.csdn.net/zhangqiqiyihao/article/details/109539373

一、sklearn中svm的引數

clf = svm.SVC(C=1.0, kernel='linear', decision_function_shape='ovr')

C：懲罰引數。預設值是1.0，C越大，相當於懲罰鬆弛變數，希望鬆弛變數接近0，即對誤分類的懲罰增大，趨向於對訓練集全分對的情況，這樣對訓練集測試時準確率很高，但容易過擬合，高方差，泛化能力弱。C值小，對誤分類的懲罰減小，允許容錯，將他們當成噪聲點，泛化能力較強，但過小容易欠擬合，高偏差。
kernel：‘linear’:線性核函式
‘poly’：多項式核函式
‘rbf’：徑像核函式/高斯核
‘sigmod’:sigmod核函式
decision_function_shape 用於svm的多分類，ovr為一對多
方法
svc.fit(x,y)方法，用於訓練svm
svc.predict(X)方法，基於以上的訓練，對預測樣本T進行類別預測，因此只需要接收一個測試集T，該函式返回一個陣列表示個測試樣本的類別。
svc.score(y_train, predict(x_train)) 返回給定測試資料和標籤的平均精確度
svc.decision_function(X) 樣本X到分離超平面的距離

二、svm用於多分類問題
在這裡插入圖片描述
svm解決的是二分類問題，要想讓其應用於多分類問題可以有如下思路：
訓練時依次把某個類別的樣本歸為一類,其他剩餘的樣本歸為另一類，這樣k個類別的樣本就構造出了k個SVM。分類時將未知樣本分類為具有最大分類函式值的那類。
比如說現在有5個類別，第一次將第一類作為正例，其餘類別作為父類進行分類，這樣便把第一類分出；
第二次將第二類和剩餘3類分開，依次進行。
此法為一對多，one-versus-rest，本次例項中的decision_function_shape='ovr’就是使用的該方法

三、standardscaler
StandardScaler類是一個用來講資料進行歸一化和標準化的類。-計算訓練集的平均值和標準差，以便測試資料集使用相同的變換。
四、使用svm進行故障分類例項

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from sklearn import svm
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

data = pd.read_csv('./train.csv',header=0)
label = np.array(data['label'])
train = data.iloc[:,1:-1]
train = abs(np.fft.fft(train)[:,:3001])/6000

d1 = np.array(data.iloc[1,1:-1])
n = len(d1)

yy = np.fft.fft(d1)
yy_ = yy[range(0,int(n/2))]
plt.plot(abs(yy_)/n)
plt.show()

x_train,x_test,y_train,y_test = train_test_split(train,label,random_state=1,train_size=0.7)
#train_test_split(待劃分樣本集合，待劃分樣本標籤，train_size測試集和樣本數目之比)

ss = StandardScaler()

x_train = ss.fit_transform(x_train)
x_test = ss.fit_transform(x_test)

clf = svm.SVC(C=1.0, kernel='linear', decision_function_shape='ovr')
#c為錯誤項的懲罰係數，kernel為演算法中採用的核函式型別 linear為線性核函式
#decision_function_shape 構造多分類器的方法有兩種 ovr為一對多比如說5類資料5個svm，第一次將第一類和其他4類分別作為正負樣本分離

clf.fit(x_train,y_train)

print(clf.score(x_train,y_train))
print("訓練集準確率：",accuracy_score(y_train,clf.predict(x_train)))
print("測試集準確率：",accuracy_score(y_test,clf.predict(x_test)))

基於sklearn的分類器實戰
2019-05-25
sklearn建模及評估（分類）
2019-09-04
基於Pytorch實現貓狗分類
2021-06-08
PyTorch
機器學習|決策樹-sklearn實現
2020-12-19
機器學習
基於Sklearn機器學習程式碼實戰
2022-11-25
機器學習
整合學習(1)AdaBoost分別應用於分類和迴歸及其python實現
2020-12-03
Python
教程 | 用Scikit-Learn實現多類別文字分類
2018-05-14
文字分類
機器學習實戰 | SKLearn最全應用指南
2022-03-21
機器學習
【機器學習】線性迴歸sklearn實現
2019-01-17
機器學習
使用jupyter實現貓和狗的分類
2018-12-12
sklearn學習第一篇：knn分類
2019-07-28
KNN
Sklearn中的樸素貝葉斯分類器`
2020-10-20
torch--多層感知機實現影像分類
2024-11-04
用Python實現一個SVM分類器策略
2018-12-28
Python
基於Tensorflow + Opencv 實現CNN自定義影像分類
2021-09-22
OpenCVCNN
【機器學習】多項式迴歸sklearn實現
2019-03-10
機器學習
Pytorch實現分類器
2023-04-17
PyTorch
Backblaze：2023硬碟實測故障率顯示SSD比機械硬碟更可靠
2023-10-06
硬碟
[譯] Sklearn 中的樸素貝葉斯分類器
2018-08-28
使用ProxySQL實現MySQL Group Replication的故障轉移、讀寫分離（一）
2020-08-01
MySql
通用mapper和分類實現
2018-03-15
APP
Blackblaze：2018年度機械硬碟故障率報告
2019-01-24
硬碟
【機器學習】--xgboost初始之程式碼實現分類
2018-06-18
機器學習
sklearn中的pipeline實際應用
2021-02-21
php 分頁分頁類簡單實用
2021-09-09
PHP
機器學習之決策樹在sklearn中的實現
2019-03-06
機器學習
運用sklearn進行主成分分析(PCA)程式碼實現
2020-08-12
PCA
6軸機械臂正逆解運算實現
2020-09-25
機械臂
SpringBoot應用使用自定義的ApplicationContext實現類
2022-06-10
Spring BootAPPContext
機器學習之使用sklearn構建據類模型，並且評價模型
2020-12-31
機器學習模型
技術乾貨|如何實現分鐘級故障管理
2022-09-23
概率分類之樸素貝葉斯分類（垃圾郵件分類python實現）
2020-10-05
Python
Backblaze：2018年Q1機械硬碟故障率報告
2018-05-02
硬碟
機械硬碟，使用注意事項
2024-12-09
硬碟
機器學習Sklearn系列：（五）聚類演算法
2021-07-22
機器學習聚類演算法
Bert文字分類實踐（一）：實現一個簡單的分類模型
2021-10-10
文字分類模型
PHP實現無限極分類
2018-12-02
PHP
運用sklearn進行線性判別分析(LDA)程式碼實現
2020-08-17
LDA

使用sklearn實現svm--用於機械故障分類

相關文章