基於sklearn的波士頓房價預測_線性迴歸學習筆記

玫瑰少年發表於2021-04-02

原文網址 : https://www.cnblogs.com/mgsn/p/14603435.html

> 　以下內容是我在學習https://blog.csdn.net/mingxiaod/article/details/85938251 教程時遇到不懂的問題自己查詢並理解的筆記，由於sklearn版本更迭改動了原作者的程式碼，如有理解偏差歡迎指正。

　1. np.linspace　　

　　　　np.linspace(1,10) 在numpy中生成一個等差數列，可以加三個引數，np.linspace（1，10，10）在是兩個引數時預設生成五十個數字的等差數列，第一第二哥數字分別代表數列的開頭和結尾，如果是三哥引數，第三個引數代表等差數列的長度，既可以生成一個長度為10數字開頭為1結尾為10的等差數列（1，2，3，4，5，6，7，8，9，10）

　　2. plt.subplot(nrows, ncols, index, **kwargs)

　　　　plt.subploy(2,3,5)這個程式碼的核心意思就是使用”整數來描述子圖的位置資訊“，顧名思義就是在一個畫布中畫多個圖片，第一個引數nrows代表你把畫布分為多少行，ncols代表你把畫布分為多少列，index就更好理解了，它的意思就是接下來要畫的圖的索引位置，比如（2，3，5）他代表的意思就是把一張空白的畫布分為兩行，三列。六個位置區域，第三個索引引數一般就是從左上角開始到右下角依次編號（如下圖），我查閱資料的時候有的博主強行機器翻譯官方文件，並註明第三個引數不能大於10,其實不然，官方的意思是index<= nrows*ncols，也就是索引數字不能大於已有的畫布分割數量。還有就是（2，3，5）與（235）效果等同，至於第三個引數**kwargs，作用是設定子圖型別，極點圖或線型圖。

　　3.np.delete(x_data,abnormal_data,axis = 0)

　　　　第一個引數代表要處理的資料矩陣，第二個引數代表在什麼位置處理（一般為一維陣列），第三個引數 0 代表刪除所在列，1代表刪除所在行。

 1 from sklearn import preprocessing
 2 from sklearn.datasets import load_boston
 3 from sklearn.metrics import r2_score
 4 from sklearn.linear_model import LinearRegression
 5 from sklearn.model_selection import train_test_split
 6 import matplotlib.pyplot as plt
 7 import numpy as np
 8 
 9 #資料初始化
10 dataset = load_boston()
11 x_data,y_data=load_boston(return_X_y = True) #匯入資料，x_data為特徵變數、y_data為目標值
12 print("--------------'''獲取自變數資料的形狀'''--------------")
13 print(x_data.shape)
14 print(y_data.shape)
15 name_data = dataset.feature_names #匯入特證名
16 
17 #資料視覺化
18 for i in range(len(name_data)):
19     plt.scatter(x_data[:,i],y_data,s = 20,marker = '<',c = 'r')
20     plt.title(name_data[i])
21     plt.show()
22 #處理異常資料
23 abnormal_data = []
24 for i in range(len(y_data)):
25     if y_data[i] == 50:
26         abnormal_data.append(i)#儲存異常值的下標；
27 x_data = np.delete(x_data,abnormal_data,axis = 0)#刪除值為y值為50的特徵變數所在行
28 y_data = np.delete(y_data,abnormal_data,axis = 0)#刪除值為y值為50的特徵值所在行
29 print("------檢測-------")
30 print(x_data.shape)
31 print(y_data.shape)
32 
33 abnormal_title = []
34 for i in range(len(name_data)):
35     if name_data[i] == 'RM' or name_data[i] =='PTRATIO'or name_data[i] == 'LSTAT':
36         continue
37     else:
38         abnormal_title.append(i)#儲存不相關資料特證名下標
39 x_data = np.delete(x_data,abnormal_title,axis = 1)#刪除不相關資料所在列
40 print("--------------'''輸出有效資料形狀'''--------------")
41 print(x_data.shape)
42 print(y_data.shape)
43 
44 #資料分割
45 x_train,x_test = train_test_split(x_data,test_size=0.2,random_state=0)
46 y_train,y_test = train_test_split(y_data,test_size=0.2,random_state=0)
47 print("--------------'''輸出實驗資料長度'''--------------")
48 print(len(x_train))
49 print(len(x_test))
50 print(len(y_train))
51 print(len(y_test))
52 
53 #資料歸一化(無量綱化處理β=(x-min(x))/max(x)-min(x),將資料歸集到0~1之間)
54 min_max_scaler = preprocessing.MinMaxScaler()
55 x_test = min_max_scaler.fit_transform(x_test)
56 x_train = min_max_scaler.fit_transform(x_train)
57 y_train = min_max_scaler.fit_transform(y_train.reshape(-1,1))
58 y_test = min_max_scaler.fit_transform(y_test.reshape(-1,1))#轉化為一列行自動確認
59 #模型訓練和評估
60 lr = LinearRegression()
61 lr.fit(x_train,y_train)
62 lr_y_predict = lr.predict(x_test)
63 #使用r2_score預測樣本
64 score = r2_score(y_test, lr_y_predict)
65 print("樣本預測得分：{}".format(score))

輸出結果：

--------------'''獲取自變數資料的形狀'''--------------
(506, 13)
(506,)
------檢測-------
(490, 13)
(490,)
--------------'''輸出有效資料形狀'''--------------
(490, 3)
(490,)
--------------'''輸出實驗資料長度'''--------------
392
98
392
98
樣本預測得分：0.7091901425426

波士頓房價預測
2024-03-28
基於MXNET框架的線性迴歸從零實現（房價預測為例）
2021-05-10
框架
實驗1-波士頓房價預測
2024-04-25
Python數模筆記-Sklearn（4）線性迴歸
2021-05-13
Python筆記
【機器學習】線性迴歸預測
2022-06-23
機器學習
【機器學習】線性迴歸sklearn實現
2019-01-17
機器學習
Python學習筆記-StatsModels 統計迴歸（1）線性迴歸
2021-05-06
Python筆記
深度學習筆記002-線性迴歸
2020-10-28
深度學習筆記
學習筆記——機器學習演算法（一）: 基於邏輯迴歸的分類預測
2020-12-15
筆記機器學習演算法邏輯迴歸
5. `sklearn`下的線性迴歸
2022-06-19
【機器學習筆記】：大話線性迴歸（二）
2021-01-03
機器學習筆記
【機器學習筆記】：大話線性迴歸（一）
2021-01-06
機器學習筆記
使用線性迴歸模型預測黃金ETF價格
2024-07-09
模型
Python機器學習筆記：使用Keras進行迴歸預測
2019-01-02
Python機器學習筆記Keras
線性基學習筆記
2024-09-07
筆記
機器學習：線性迴歸
2024-11-19
機器學習
吳恩達機器學習筆記 —— 3 線性迴歸回顧
2018-07-15
吳恩達機器學習筆記
機器學習（課堂筆記）Day04：線性迴歸法
2020-11-13
機器學習筆記
機器學習程式碼筆記-2-簡單線性迴歸
2022-06-23
機器學習筆記
機器學習入門學習筆記：（2.1）線性迴歸理論推導
2019-02-15
機器學習筆記
【動手學深度學習】第三章筆記：線性迴歸、SoftMax 迴歸、交叉熵損失
2023-04-09
深度學習筆記熵
機器學習 | 線性迴歸與邏輯迴歸
2020-09-23
機器學習邏輯迴歸
吳恩達機器學習筆記 —— 2 單變數線性迴歸
2018-07-10
吳恩達機器學習筆記變數
吳恩達機器學習筆記 —— 5 多變數線性迴歸
2018-07-16
吳恩達機器學習筆記變數
機器學習之線性迴歸
2020-02-07
機器學習
機器學習：線性迴歸（下）
2024-11-26
機器學習
有監督學習——線性迴歸
2023-03-10
機器學習整理（線性迴歸）
2022-03-12
機器學習
預測演算法之多元線性迴歸
2021-03-28
演算法
【深度學習基礎-13】非線性迴歸 logistic regression
2019-01-14
深度學習
【深度學習基礎-10】簡單線性迴歸（上）
2019-01-11
深度學習
計量經濟學複習筆記（二）：一元線性迴歸(下)
2021-01-01
筆記
機器學習演算法（一）: 基於邏輯迴歸的分類預測
2020-11-09
機器學習演算法邏輯迴歸
機器學習(二)：理解線性迴歸與梯度下降並做簡單預測
2021-01-19
機器學習梯度
機器學習5-線性迴歸
2021-01-20
機器學習
AdaBoost 演算法-分析波士頓房價資料集
2020-12-17
演算法
機器學習筆記(2): Logistic 迴歸
2024-06-07
機器學習筆記
【機器學習】線性迴歸python實現
2019-01-17
機器學習Python

基於sklearn的波士頓房價預測_線性迴歸學習筆記

相關文章