迴歸模型-評估指標
一、多元線性迴歸
多元線性迴歸示例:
y = b+a_1*x_1+a_2*x_2+···+a_n*x_n
房價預測案例:
多重共線性(Multicollinearty):
是指線性迴歸模型中的 解釋變數(X)之間
由於存在高度相關關係而使模型估計失真或難以估計準確
多重共線性的影響:
上述模型引數($a_1,a_2...$)估值不準,有時候會導致出現相關性反轉。
如何發現多重共線性
對X變數探索兩兩之間的相關性(相關矩陣)
逐步迴歸概念是一種多元迴歸模型進行變數篩選的方法,篩選最少的變數來獲取最大化預測能力
三種方法:
向前選擇法
向後剔除法
逐步迴歸法
二、正則化防止過擬合
- L2正則化–嶺迴歸 Ridge Regression
在最小化殘差平方和的基礎上,增加L2範數的懲罰項:
\sum_{i=1}^{n}\left ( y_i-\beta_0-\sum_{j=1}^{p}\beta _jx_{ij} \right )^2+\lambda\sum_{j=1}^{p}\beta_j^2=RSS +\lambda\sum_{j=1}^{p}\beta_j^2- L1正則化–lasso迴歸
在最小化殘差平方和的基礎上,增加L1範數的懲罰項:
\sum_{i=1}^{n}\left( y_i-\beta_0-\sum_{j=1}^{p}\beta _jx_{ij} \right )^2+\lambda\sum_{j=1}^{p}|\beta_j|=RSS +\lambda\sum_{j=1}^{p}|\beta_j|
三、非線性迴歸:多項式迴歸
- 方法:
- 非線性迴歸的轉換——取對數
多項式迴歸程式碼實現:
sklearn.preprocession.PolynomialFeatures(
degree = 2, #階數
interaction_only = False,
include_bias = True
)
sklearn.linear_model.LinearRegression(
fit_intercept = True,
noemalize = False,
copy_X = True
)
3.1 迴歸模型評估指標
- 解釋方差(Explianed variance score):
- 絕對平均誤差(Mean absolute error):
- MAE(y,\hat{y}) = \frac{1}{n_{samplies}}\sum_{i=0}^{n_{samplies}-1}|y_i-\hat{y}|
- 均方誤差(Mean squared error):
- MSE(y,\hat{y}) = \frac{1}{n_{samplies}}\sum_{i=0}^{n_{samplies}-1}(y_i-\hat{y})^2
- 決定係數(R^2score)
- R^2(y,\hat{y}) =1-\frac{\sum_{i=0}^{{n_{samplies}}^{-1}}(y_i-\hat{y_i})^2}{\sum_{i=0}^{{n_{samplies}}^{-1}}(y_i-\bar{y})^2}
程式碼:
sklearn.metrics
from sklearn.metrics import explained_variance_score
explained_variance_score(y_true,y_pred)
from sklearn.metrics import mean_absolute_error
mean_absolute_error(y_true,y_pred)
from sklearn.metrics import mean_squared_error
mean_squared_error(y_true,y_pred)
from sklearn.metrics import r2_score
r2_score(y_true,y_pred)
四、決策樹(分類迴歸樹)分類標準
>
Gain(A) = Variance(父) - Variance(子) #Gain(A)資訊增益
五、相關和迴歸
5.1 相關和迴歸的關係
都是研究變數相互關係的分析方法
相關分析是迴歸分析基礎和前提,迴歸分析是變數之間相關程度的具體形式
相關分析:正相關,負相關
相關形式: 線性, 非線性
>
5.2 線性相關性度量:皮爾遜相關係數
r = \frac{\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^{n}(x_i-\bar{x})^2}\sqrt{\sum_{i=1}^{n}(y_i-\bar{y})^2}}
相關VS迴歸:
六、一元線性迴歸
6.1 一元線性迴歸模型
- 尋找最佳擬合直線:最小二乘法
- 該方法是尋找最佳擬合直線的引數(斜率和截距)
引數估計迴歸表示式:\hat{Y_i} = \hat{β_0}+\hat{β_1}x_i - 斜率:~~~~~~\hat{\beta_1}=\frac{SS_{xy}}{SS_{xx}} = \frac{\sum(x_i-\bar{x})y_i-\bar{y})}{\sum(x_i-\bar{x})^2}
截 距:~~~~~~~~ \hat{β_0} = \bar{y}-\hat{β_1}\bar{x}~~~~~~~~ ~~~~~~~~~~~~~~~~~~~~~~~~~
七、課程總結
分類與迴歸 區別與聯絡
相似之處:
都是有監督學習
最重要的兩種預測模型
決策樹既可以分類 也可以做迴歸
二元分類模型的經典演算法邏輯迴歸演算法,本質上也是一種迴歸演算法
區別:
迴歸目標變數是連續型變數
分類目標變數是類別型變數
常見的餓迴歸演算法和模型
1 基於最小二乘法的一元/多元線性迴歸
2 多項式迴歸(非線性)
3 Ridge 迴歸(L2正則化迴歸),嶺迴歸
4 Lasso 迴歸(L1正則化迴歸),套索迴歸
5 決策樹(CART,分類迴歸樹)
6 邏輯迴歸
相關文章
- 迴歸預測評估指標指標
- 《Spark機器學習》筆記——Spark迴歸模型(最小二乘迴歸、決策樹迴歸,模型效能評估、目標變數變換、引數調優)Spark機器學習筆記模型變數
- 一文詳盡系列之模型評估指標模型指標
- 機器學習之迴歸指標機器學習指標
- 評估指標與評分(上):二分類指標指標
- 語音識別 (ASR) 模型測試 之 評估指標探索模型指標
- 機器學習筆記之效能評估指標機器學習筆記指標
- 【火爐煉AI】機器學習004-嶺迴歸器的構建和模型評估AI機器學習模型
- 分類演算法的評估指標演算法指標
- 工程團隊的10大評估指標指標
- 【推薦系統】評估指標總結指標
- 誰說Java無指標, JAVA連結串列指標也好煩 - Java 指標迴歸Java指標
- 【機器學習】--模型評估指標之混淆矩陣,ROC曲線和AUC面積機器學習模型指標矩陣
- 迴歸模型的演算法效能評價模型演算法
- IQA+不懂︱影像清洗:影像質量評估(評估指標、傳統檢測方法)指標
- 演算法金 | 必會的機器學習評估指標演算法機器學習指標
- 【火爐煉AI】機器學習006-用決策樹迴歸器構建房價評估模型AI機器學習模型
- 機器學習之模型評估機器學習模型
- Java: 實現自迴歸分析/線性迴歸分析/基金各項指標計算等Java指標
- 邏輯迴歸模型邏輯迴歸模型
- AI 模型常見的評價指標彙總AI模型指標
- opencv-9-影像噪聲以及評估指標 PSNR 與SSIMOpenCV指標
- 評估智慧對話機器人的7大資料指標機器人大資料指標
- 流量渠道資料分析方法與價值評估指標體系指標
- 多元線性迴歸模型模型
- 如何評估大語言模型模型
- 迴流出價工具 淺層迴流指標 深層ROI指標指標
- 六種GAN評估指標的綜合評估實驗,邁向定量評估GAN的重要一步指標
- 直擊RSAC 2022:如何綜合評估威脅情報指標指標
- 指標-又見迴文指標
- 【小白學AI】線性迴歸與邏輯迴歸(似然引數估計)AI邏輯迴歸
- PRML 迴歸的線性模型模型
- 二分類問題中混淆矩陣、PR以及AP評估指標矩陣指標
- GNN 模型評估的一些陷阱GNN模型
- GNN模型評估的一些陷阱GNN模型
- 模型評估與改進:交叉驗證模型
- 效能優化-使用 RAIL 模型評估效能優化AI模型
- O'Reilly Report:評估機器學習的模型機器學習模型