機器學習流程，常規演算法，降維方法

大樹2發表於2018-03-01

1 場景解析: a.資料探查(資料量的大小,資料缺失或亂碼,ETL 操作,欄位型別,是否含有目標佇列)

b.場景抽象(是通過已有的資料，挖掘出可以應用的業務場景。機器學習主要用來解決的場景包括二分類、多分類、聚類和迴歸)

c.演算法選擇(是確定演算法範圍、多演算法嘗試和多視角分析尋找最適合自身業務的演算法)

2 資料預處理:取樣、去噪、歸一化(0,1)和資料過濾,把資料探勘看成做一道菜的話，資料預處理就是選擇和清洗蔬菜的過程，這一步沒做好會影響整個菜品的口感.

3.特徵工程:是特徵抽象(將源資料抽象成演算法可以理解的資料)、特徵重要性評估、特徵衍生(特徵衍生的方法來挖掘更有價值的特)和特徵降維幾個方面(主成分分析。PCA 通過線性對映投影的方法，把高維的資料對映到了低維的空間中,線性判別式分析LDA)

時間戳,二值類問題,多值有序類問題,多值無序類問題（資訊閹割）,多值無序類問題（One-hot 編碼）,文字型別,影象或語音資料(先將影象或者語音轉化成矩陣結構).

4.模型搭建，評估，調優
5.結果輸出和分析

常規演算法

deep learing

反向傳播演算法又稱BP 演算法（backpropagation algorithm），是一種監督學習演算法演算法的核心思想是求導的鏈式法則。BP 演算法常被用來求解神經網路中的最優化問題，跟淺層演算法的最優化求解不同的地方是BP 演算法可以用鏈式法則對每一層迭代計算梯度.

自動編碼（AutoEncoder）的核心思想就是通過訓練生成一個函式F，使F(x)約等於x，也就是得到一個函式使輸入和輸出儘可能相等.

對機器學習演算法和深度學習常見結構有系統學習。常見演算法如下：

機器學習演算法：

分類演算法：KNN,NB,LR,RF,SVM等

聚類演算法：K-means,DBSCAN

迴歸演算法：線性迴歸

文字分析演算法：分詞演算法Hmm,關鍵詞提取演算法TF-IDF,主題模型LDA

推薦類演算法：協同過濾CF(UCF/ICF)

關係圖演算法：標籤傳播，最短路徑

常用的降維方法：確保向量間的獨立性，減少關聯減少計算量去噪，把對結果沒有意義的或意義較小的欄位去掉，減少不必要的干擾。深度學習常見結構：深度神經網路DNN 卷積神經網路CNN(卷積，下采樣，全連線），主要對空間資料的處理，輸入層格式統一。迴圈神經網路RNN，常用來解決時序行為的問題。輸入層格式可以不統一。

圖解機器學習 | 降維演算法詳解
2022-03-11
圖解機器學習演算法
【機器學習】李宏毅——線性降維
2022-12-16
機器學習
機器學習降維之主成分分析
2019-07-18
機器學習
機器學習基礎-資料降維
2019-05-02
機器學習
機器學習—降維-特徵選擇6-4（PCA-Kernel方法）
2022-03-16
機器學習特徵PCA
機器學習降維之線性判別分析
2019-07-19
機器學習
吳恩達機器學習筆記 —— 15 降維
2018-07-30
吳恩達機器學習筆記
[譯] 降維技術中常用的幾種降維方法
2019-01-21
JS演算法——陣列降維
2018-05-29
JS演算法陣列
機器學習之特徵選擇和降維的理解
2017-09-23
機器學習特徵
機器學習（五）：混合高斯聚類GMM（求聚類標籤）+PCA降維（3維降2維）習題
2023-04-08
機器學習聚類PCA
聊聊不太符合常規思維的動態規劃演算法
2023-03-30
動態規劃演算法
簡述多種降維演算法
2018-09-23
演算法
機器學習_用PCA主成分分析給資料降維
2017-11-21
機器學習PCA
機器學習_用SVD奇異值分解給資料降維
2017-11-22
機器學習
Barnes-Hut t-SNE:大規模資料的高效降維演算法
2024-04-23
演算法
dataguard 常規運維操作
2017-03-13
運維
資料分析中的降維方法初探
2017-03-21
一分鐘瞭解降維演算法
2024-01-08
演算法
資料降維和特徵工程方法綜述
2016-03-23
特徵工程
【機器學習】--主成分分析PCA降維從初識到應用
2018-04-10
機器學習PCA
【機器學習基礎】無監督學習（2）——降維之LLE和TSNE
2022-03-21
機器學習
個人分享 | 我的常規爬蟲流程
2018-10-31
爬蟲
[圖解] 機器學習常見的基本演算法
2018-03-09
圖解機器學習演算法
機器學習-異常檢測演算法（二）：LocalOutlierFactor
2017-08-01
機器學習演算法
機器學習常見演算法分類彙總
2014-09-26
機器學習演算法
神經網路中的降維和升維方法 (tensorflow & pytorch)
2021-01-09
神經網路PyTorch
【方法論】機器學習演算法概覽
2018-08-01
機器學習演算法
機器學習演算法公式的書寫規範
2019-04-11
機器學習演算法公式
cookie常規實用方法合集
2020-10-14
Cookie
常見機器學習演算法背後的數學
2020-08-21
機器學習演算法
Python實現常見機器學習演算法(上)
2017-11-25
Python機器學習演算法
機器學習常見的演算法面試題總結
2016-04-16
機器學習演算法面試題
機器學習常見演算法個人總結（面試用）
2016-05-07
機器學習演算法面試
【火爐煉AI】機器學習053-資料降維絕招-PCA和核PCA
2019-03-03
AI機器學習PCA
Oracle 11g RMAN的常規維護
2016-11-03
Oracle
降維演算法 0基礎小白也能懂(附程式碼)
2024-09-13
演算法
降維與度量學習
2018-12-04

機器學習流程，常規演算法，降維方法

相關文章