機器學習實戰之開篇

紫鳳發表於2013-07-26

原文地址：夜月星

機器學習實戰之開篇

首先說點兒題外話,上上週末去了趟杭州參加阿里巴巴2013的ADC技術嘉年華,感覺阿里巴巴的大資料不說牛逼只能說運用的真是淋漓盡致,人家有的是使用者資源,這麼多財富不充分挖掘真是對不起d對不起gj更對不起自己,期間趕上圖靈打折,就順手入了一本"機器學習實戰",所以,準備把學習過程記錄下來,一是在整理的時候自己也能夠理清思路,二是督促自己貴在堅持,最後,如果有人能看到我寫的這篇文章那麼就當奉獻了

本人非工作需求,純屬自娛自樂,如有錯誤在所難免

準備按照這本書的章節順序分享自己學習心得,另外,如果涉及到一些例如數學,資訊學等知識也可能單獨提取出來分享

什麼是機器學習

不廢話,具體參看維基,從定義我們可以看出機器學習包含了太多方面,總之個人感覺機器學習本質上就是一種人工智慧,只不過這種人工智慧應用在領域,比如資料預測,資料分類等

機器學習主要任務

主要學習一下幾個方面:

監督學習

　 - 分類:解決如何將資料劃分到合適的分類中

　- 迴歸:主要用於預測數值型資料
無監督學習:與監督學習相對,此時的資料沒有分類資訊也不會有目標值

　- 聚類:將資料集合分成有類似的物件組成的多個類的過程

　 - 密度估計:將尋找資料統計值的過程成為密度估計

　- 降維:減少資料特徵維度,以便通過二維或者三維圖形展示資料資訊

機器學習演算法開發步驟

收集資料

　 - 利用爬蟲從網站抓取資料

　 - 裝置提供的資料

　 - 手動生成的資料

　 - ......
格式化資料

　- 資料型別格式化

　- 資料格式格式化
分析資料

　 - 這一步驟通過人工分析資料來確保資料的正確性

　 - 分析資料合理性,例如某個個別資料和其它資料有強烈地"違和感",此時需要特殊處理

　- 可以通過二維或者三維展示資料資訊
訓練演算法

　- 將前面產生的資料輸入到演算法,從而使機器從中抽取知識和資訊

　 - 主要是監督演算法使用,無監督演算法無法使用(因為無監督演算法不存在目標變數值,故而也不需要訓練演算法,監督學習其實就可以看成先訓練再使用,由wiki定義也可以發現這一點)
測試演算法

　 - 監督學習和無監督學習都要進行此過程

　- 監督學習必須知道目標變數值才能測試正確性

　- 無監督學習要通過其他手段判斷正確性,例如人工

　 - 如果測試不理想要考慮以下幾個方面:

　　 - 演算法:例如引數調整程式碼調整等

　　- 資料:例如資料量太小或者太特殊等
使用演算法

使用語言

這本書中使用Python語言,其實用Python更能讓我們初學者把精力放到演算法本身上而非程式碼本身,同樣一個簡單的功能可能用C或者Java實現起來要多幾倍的程式碼,況且如果演算法思想掌握了再把Python轉成C相對來說就容易了

機器學習實戰之Logistic迴歸
2018-06-25
機器學習
【機器學習】帶你3分鐘看完《機器學習實戰》總結篇
2018-03-10
機器學習
《機器學習實戰》學習大綱
2018-12-01
機器學習
python機器學習實戰（二）
2018-12-26
Python機器學習
【Python機器學習實戰】感知機和支援向量機學習筆記（三）之SVM的實現
2021-08-11
Python機器學習筆記
機器學習之必備知識篇
2019-03-17
機器學習
回顧·機器學習/深度學習工程實戰
2019-02-21
機器學習深度學習
《機器學習實戰》第一章機器學習基礎
2018-11-25
機器學習
【Python機器學習實戰】決策樹與整合學習（六）——整合學習（4）XGBoost原理篇
2021-09-11
Python機器學習
【機器學習PAI實戰】—— 玩轉人工智慧之綜述
2019-03-21
機器學習AI人工智慧
機器學習實踐篇第二篇-KNN演算法學習
2024-04-02
機器學習KNN演算法
機器學習30天進階實戰
2020-04-04
機器學習
機器學習入門實戰疑問
2020-04-30
機器學習
機器學習實戰（十三）：Convolutional Neural Networks
2020-12-27
機器學習
DDD實戰課（實戰篇）--學習筆記
2021-06-19
筆記
【機器學習】--Python機器學習庫之Numpy
2018-04-06
機器學習Python
機器學習之學習速率
2020-06-12
機器學習
【機器學習PAI實戰】—— 玩轉人工智慧之美食推薦
2019-03-26
機器學習AI人工智慧
機器學習之step by step實戰及知識積累筆記
2018-06-13
機器學習筆記
機器學習——原理篇
2018-10-16
機器學習
基於Sklearn機器學習程式碼實戰
2022-11-25
機器學習
《scikit-learn機器學習實戰》簡介
2022-06-22
機器學習
機器學習實戰 | SKLearn最全應用指南
2022-03-21
機器學習
機器學習實戰（一）—— 線性迴歸
2020-12-01
機器學習
機器學習實戰6（SMO演算法）
2018-03-20
機器學習演算法
面向機器智慧的TensorFlow實戰4：機器學習基礎
2018-05-25
機器學習
【Python機器學習實戰】決策樹和整合學習（一）
2021-08-19
Python機器學習
初學者的機器學習入門實戰教程！
2019-03-22
機器學習
機器學習之學習曲線
2019-09-18
機器學習
Spark機器學習實戰 (十一) - 文字情感分類專案實戰
2019-04-19
Spark機器學習
機器學習之pca
2024-06-17
機器學習PCA
機器學習之皮毛
2021-04-14
機器學習
《機器學習實戰》-01機器學習基礎 #win8-anaconda prompt配置jupyter notebook
2018-12-07
機器學習
Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記2 — 機器學習的主要挑戰
2018-11-26
機器學習筆記
【Python機器學習實戰】決策樹與整合學習（三）——整合學習（1）
2021-08-30
Python機器學習
機器學習實戰-SVM模型實現人臉識別
2022-06-17
機器學習模型
機器學習之支援向量機原理和sklearn實踐
2019-06-30
機器學習
Docker小白到實戰之開篇概述
2021-08-16
Docker
【Python機器學習實戰】決策樹與整合學習（四）——整合學習（2）GBDT
2021-09-03
Python機器學習

機器學習實戰之開篇

機器學習實戰之開篇

什麼是機器學習

機器學習主要任務

機器學習演算法開發步驟

使用語言

相關文章