sklearn基本操作程式碼練習

sgsdsdd發表於2020-10-01

庫目錄

一、datasets(資料集)

from sklearn import datasets
boston = datasets.load_boston()
#載入並返回波士頓房價資料集(迴歸)
import pandas as pd
from sklearn import datasets
boston = datasets.load_boston()
boston_df = pd.DataFrame(boston.data,columns = boston.feature_names)
#用DataFrame將資料集格式化
boston_df.head(20)

二、preprocessing(預處理和規範化)

from sklearn import preprocessing
#預處理和規範化
std = preprocessing.StandardScaler()
#通過去除均值並縮放到單位方差來標準化特徵
std.get_params()
#獲取此估計量的引數
std.set_params(copy=False)
std.fit(boston.data)
#計算均值和std以用於以後的縮放
std.mean_
#訓練集中每個特徵的平均值
std.var_
#訓練集中每個要素的方差
std.transform(boston.data)
#通過居中和縮放執行標準化

三、linear_model(線性模型)

from sklearn import linear_model
reg = linear_model.LinearRegression()
#普通最小乘線性迴歸
reg
reg.fit(boston.data,boston.target)
#擬合線性模型
reg.coef_
#線性迴歸問題的估計係數
pred = reg.predict(boston.data)
#使用線性模型進行預測
pred[:10]

相關文章