機器學習基本概念,常用經典模型

大樹2發表於2017-11-08

1. 機器學習明白一些基本概念

什麼是機器學習
研究如何通過計算的手段，利用經驗來改善系統自身的效能
通俗來講，讓程式碼學著幹活

特徵：自變數
標籤：因變數

學習的種類
有監督學習：提供標籤，分類、迴歸
無監督學習：無標籤，聚類
增強學習：也稱強化學習，馬爾科夫決策過程（Markov Decision Processes，MDP）
主動學習：邊學習邊標註
遷移學習：從一個域（Domain）遷移（Transfer）到另一個域
整合學習：Ensemble，三個臭皮匠賽個諸葛亮，Boosting和Bagging

兩大痛點
維度災難：資料量和特徵數
過擬合：模型泛化能力

學習的流程
預處理：資料重塑、缺失值處理（補全、統計為缺失特徵）
特徵工程：特徵沒做好，引數調到老。在已有的特徵上生成新的特徵，數值、類別
特徵選擇、降維：基於MIC、Pearson相關係數、正則化方法、模型，PCA、tSNE
訓練模型、調參：單模型，多模型融合，整合
評估模型：正確率（Acurracy）、準確值（Pecision）、召回值（Recall）、F值、AUC

程式碼實現
你需要的都在這裡：http://scikit-learn.org/

用機器學習來賭香港賽馬
https://www.zhihu.com/question/35131866/answer/152880313
https://www.kaggle.com/lantanacamara/hong-kong-horse-racing

2. 機器學習常用經典模型及其實現

常用經典模型
1.線性迴歸：有監督迴歸，y=WX+b，X為m維向量，y、b為n維向量，W為n*m維矩陣
2.Logistic迴歸：有監督迴歸，y=logit(WX+b)
3.貝葉斯：有監督分類，最可能的分類是概率最大的分類
4.k近鄰：有監督分類，kNN，距離的定義
5.決策樹：有監督分類，樹形判斷分支，非線形邊界，+整合=隨機森林
6.支援向量機：有監督分類，將原空間變換到另一空間，在新空間裡尋找margin最大的分介面（hyperplane）
7.k-means：無監督聚類，初始化中心，不斷迭代，EM演算法
8.神經網路：有監督和無監督都有，詳情參見下一章，深度學習

實現之前的準備
安裝scikit-learn：http://scikit-learn.org/
sklearn、numpy
>>> from sklearn import svm
>>> X = [[0, 0], [1, 1]]
>>> y = [0, 1]
>>> clf = svm.SVC()
>>> clf.fit(X, y)
SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,
decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',
max_iter=-1, probability=False, random_state=None, shrinking=True,
tol=0.001, verbose=False)
>>> clf.predict([[2., 2.]])
array([1])
一個簡單的例子：http://scikit-learn.org/stable/auto_examples/svm/plot_iris.html#sphx-glr-auto-examples-svm-plot-iris-py

Python 機器學習 HMM模型三種經典問題
2024-03-19
Python機器學習HMM模型
聊聊經典機器學習入門
2024-08-08
機器學習
機器學習經典書目彙總
2016-02-17
機器學習
linux常用經典命令
2010-04-06
Linux
機器學習經典演算法之EM
2019-07-06
機器學習演算法
機器學習經典演算法之KNN
2019-06-30
機器學習演算法KNN
經典機器學習演算法總結
2023-01-13
機器學習演算法
oracle常用經典sql查詢
2015-10-09
OracleSQL
機器學習導圖系列（5）：機器學習模型及神經網路模型
2019-04-11
機器學習模型神經網路
機器學習基本概念
2017-11-15
機器學習
[轉載] Python 機器學習經典例項
2020-11-27
Python機器學習
巨經典論文！推薦系統經典模型Wide & Deep
2020-12-09
模型IDE
oracle優化常用經典參考
2014-04-08
Oracle優化
oracle常用經典SQL查詢（轉）
2007-06-25
OracleSQL
oracle常用經典SQL查詢(zt)
2008-03-28
OracleSQL
【機器學習】李宏毅——機器學習基本概念簡介
2022-12-14
機器學習
機器學習經典演算法之決策樹
2019-06-16
機器學習演算法
機器學習教材中的 7 大經典問題
2018-01-13
機器學習
【機器學習】深度學習與經典機器學習的優劣勢一覽
2018-04-22
機器學習深度學習
大話CNN經典模型：VGGNet
2019-10-11
CNN模型
博弈論經典模型解析（入門級）
2020-09-02
模型
git常用命令（史上最經典）
2018-10-14
Git
oracle最佳化常用經典參考
2017-03-17
Oracle
機器學習經典演算法之K-Means
2019-07-01
機器學習演算法
人工智慧-深度學習-生成模型：GAN經典模型--＞InfoGAN
2021-01-02
人工智慧深度學習模型
人工智慧-深度學習-生成模型：GAN經典模型--＞VAEGAN
2021-01-02
人工智慧深度學習模型
機器學習基本概念總結
2023-01-14
機器學習
機器學習基本概念簡介
2024-04-15
機器學習
（一）文字分類經典模型之CNN篇
2024-05-08
文字分類模型CNN
Java經典常用類總結（必須掌握！）
2020-11-18
Java
幾個常用經典演算法總結
2010-05-21
演算法
Javascript中最常用的55個經典技巧
2007-08-16
JavaScript
【機器學習】第一節 - 基本概念
2024-04-06
機器學習
經典圖模型欺詐檢測系統BotGraph
2019-04-28
模型OTG
CNN結構演變總結（一）經典模型
2021-02-27
CNN模型
2018-04-21CNN經典模型
2018-04-21
CNN模型
利用ArcGIS 構建模型的一個經典例子
2012-07-20
模型
Javascript中最常用的55個經典技巧(轉)
2016-04-03
JavaScript

機器學習 基本概念,常用經典模型

相關文章

機器學習基本概念,常用經典模型