機器學習之特徵組合: 多非線性規律進行編碼

在圖 1 和圖 2 中, 我們做出如下假設:
1.藍點代表生病的樹.
2.橙點代表健康的樹.

圖 1.這是線性問題嗎 ?

您可以畫一條線將生病的樹與健康的樹清晰的分開嗎 ? 當然可以.這是個線性問題.這條線並不完美.有一兩棵生病的樹可能位於“健康”一側, 但您畫的這條線可以很好的做出預測.
現在, 我們看看下圖:

圖 2 .這是線性問題嗎 ?

您可以畫一條直線將生病的樹與健康的樹清晰的分開嗎 ?
不, 您做不到.這是個非線性問題.您畫的任何一條線都不能很好的預測樹的健康狀況.

圖 3. 一條線無法分開兩條資料

要解決圖 2 所示的非線性問題, 可以建立一個特徵組合.特徵組合是指將兩個或者多個輸入特徵相乘來對特徵空間中的非線性規律進行編碼的合成特徵. “cross” ( 組合 ) 這一術語來自 cross product ( 向量積 ) .我們通過將 x1 與 x2 組合來建立一個名為 x3 的特徵組合:
x3 = x1x2
我們像處理任何其他特徵一樣來處理這個新建的 x3 的特徵組合.線型公式變為:
y = b + w1x1 + w2x2 + w3x3
線性演算法可以算出 w3 的權重, 就想算出 w1 和 w2 的權重一樣.換言之, 雖然 w3 表示非線性資訊, 但您不需要改變線性模型的訓練方式來確定 w3 的值.

特徵組合的種類

我們可以建立很多不同種類的特徵組合.例如:

[A x B] : 將兩個特徵的之相乘形成的特徵組合.
[A x B x C x D x E] : 將五個特徵的值相乘形成的特徵組合.
[A x A] : 對單個特徵的值求平方形成的特徵組合.
通過採用隨機梯度下降法, 可以有效地訓練線性模型.因此, 在使用線性擴充套件的線性模型時輔以特徵組合一直都是訓練大規模資料集的有效方法.

本作品採用《CC 協議》，轉載必須註明作者和本文連結

Hacking

機器學習之特徵組合:組合獨熱向量
2020-06-17
機器學習特徵
機器學習之特徵工程
2020-06-14
機器學習特徵工程
機器學習之線性迴歸
2020-02-07
機器學習
Origin進行多元線性迴歸、指數擬合和非線性曲面擬合
2020-12-02
手擼機器學習演算法 - 非線性問題
2021-06-15
機器學習演算法
機器學習“特徵編碼”的經驗分享：魚還是熊掌？
2019-02-16
機器學習特徵
機器學習之良好特徵的特點
2020-06-16
機器學習特徵
機器學習-特徵提取
2019-09-07
機器學習特徵
機器學習 | 特徵工程
2019-08-22
機器學習特徵工程
機器學習——特徵工程
2020-11-02
機器學習特徵工程
機器學習特徵工程
2018-03-03
機器學習特徵工程
機器學習-無監督學習(人臉識別，使用NMF進行特徵提取)
2018-05-08
機器學習特徵
機器學習入門：多變數線性迴歸
2021-09-11
機器學習變數
機器學習降維之線性判別分析
2019-07-19
機器學習
機器學習之學習曲線
2019-09-18
機器學習
機器學習：線性迴歸
2024-11-19
機器學習
《機器學習_07_03_svm_核函式與非線性支援向量機》
2020-05-21
機器學習函式
機器學習之線性迴歸(純python實現)
2019-03-04
機器學習Python
機器學習之基於xgboost的特徵篩選
2020-03-19
機器學習特徵
用Python進行機器學習（附程式碼、學習資源）
2018-06-04
Python機器學習
機器學習：線性迴歸（下）
2024-11-26
機器學習
機器學習整理（線性迴歸）
2022-03-12
機器學習
利用Scikit-learn機器學習庫的特徵分類進行vnpy期貨量化交易（程式碼）
2019-06-26
機器學習特徵
機器學習演算法筆記之3：線性模型
2020-04-06
機器學習演算法筆記模型
從零開始學機器學習——線性和多項式迴歸
2024-09-29
機器學習
機器學習2-特徵工程
2021-01-17
機器學習特徵工程
機器學習的靜態特徵和動態特徵
2022-11-13
機器學習特徵
matlab求解非線性規劃
2024-08-11
Matlab
利用機器學習進行惡意程式碼分類
2020-08-19
機器學習
【機器學習】線性迴歸預測
2022-06-23
機器學習
機器學習5-線性迴歸
2021-01-20
機器學習
【機器學習之數學】03 有約束的非線性優化問題——拉格朗日乘子法、KKT條件、投影法
2019-06-24
機器學習優化
機器學習之支援向量機（線性模型）的最佳化問題
2020-07-04
機器學習模型
PAT-B 1056 組合數的和【規律】
2019-02-24
深入學習Java虛擬機器——虛擬機器位元組碼執行引擎
2018-08-31
Java虛擬機
關於線性規劃非線性規劃與凸優化
2018-06-30
優化
吳恩達機器學習筆記 —— 5 多變數線性迴歸
2018-07-16
吳恩達機器學習筆記變數
SparkML機器學習之特徵工程（一）特徵提取（TF-IDF、Word2Vec、CountVectorizer）
2018-04-08
Spark機器學習特徵工程

機器學習之特徵組合: 多非線性規律進行編碼

圖 1.這是線性問題嗎 ?

圖 2 .這是線性問題嗎 ?

圖 3. 一條線無法分開兩條資料

特徵組合的種類

相關文章