趣味機器學習入門小專案(附教程與資料)
微信公眾號
關鍵字全網搜尋最新排名
【機器學習演算法】:排名第一
【機器學習】:排名第一
【Python】:排名第三
【演算法】:排名第四
沒有任何理論可以代替實踐,雖然教材和課程能讓你掌握一些基本原理,但在嘗試應用時,你會發現具體操作起來比較困難。因此專案有助於提高應用機器學習的技巧,此外在找工作中也會給自己增添一些籌碼。
這個專案的目標是將現成模型應用到不同的資料集。首先,你會根據直覺為問題找到對應的模型,實踐檢驗該模型是否對資料丟失具有魯棒性、是否適合處理哪種類別特徵;其次,本專案將教會你快速設計初始模型的技能,在實際應用中,我們一般會先找到一個簡單模型進行快速實現以確定一個baseline,逐步提升模型效能,而不是一蹴而就的完成;最後,這個練習可以幫助你掌握建模的流程。下面我裡除了一個機器學習問題處理的通用性步驟例如:
-
匯入資料
-
資料清洗
-
將資料集拆成訓練/測試或交叉驗證集
-
預處理
-
變換
-
特徵工程
因為使用現成的模型,這促使你有更多的機會專注於學習上述的這些關鍵步驟,通過以下教程可以練習迴歸、分類和聚類演算法。
首先介紹一下該專案中所使用到的資料來源:
-
UCI機器學習庫——350多個可檢索資料集,幾乎涵蓋每一個主題。
http://archive.ics.uci.edu/ml/
-
Kaggle資料集——Kaggle社群上的100多個資料集。
https://www.kaggle.com/datasets
-
Data.gov——由美國政府釋出的開放資料集。
https://www.data.gov/
其次是教程,專案中的模型使用Python的第三方庫Scikit-learn進行快速實現,需要了解scikit-learn的安裝以及使用方法(參考官方手冊),具體如下:
-
Python:sklearn——sklearn資料包官方教程
http://scikit-learn.org/stable/tutorial/
-
中文教程手冊:
http://cwiki.apachecn.org/pages/viewpage.action?pageId=10030179
-
Scikit Learn預測葡萄酒質量——用於訓練機器學習模型的分步教程
http://elitedatascience.com/python-machine-learning-tutorial-scikit-learn

招募 志願者
廣告、商業合作
請發郵件:357062955@qq.com

喜歡,別忘關注~
幫助你在AI領域更好的發展,期待與你相遇!
相關文章
- 【機器學習入門與實踐】合集入門必看系列,含資料探勘專案實戰,適合新人入門機器學習
- 機器學習博士手把手教你入門LSTM(附程式碼資料)機器學習
- 機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)機器學習
- 初學者的機器學習入門實戰教程!機器學習
- Python學習手冊(入門&爬蟲&資料分析&機器學習&深度學習)Python爬蟲機器學習深度學習
- MLFlow機器學習管理平臺入門教程一覽機器學習
- 機器學習入門準備機器學習
- 機器學習之小白入門機器學習
- 機器學習入門規劃機器學習
- 機器學習PAI快速入門機器學習AI
- 機器學習01-入門機器學習
- 五個給機器學習和資料科學入門者的學習建議機器學習資料科學
- 機器學習和深度學習概念入門機器學習深度學習
- 近期 github 機器學習熱門專案top5Github機器學習
- 5月Github上最熱門的資料科學和機器學習專案TOP5Github資料科學機器學習
- 用一個小例子教你入門機器學習框架TensorFlow機器學習框架
- 機器學習PAI快速入門與業務實戰機器學習AI
- 《Python入門與資料科學庫》學習筆記Python資料科學筆記
- 資料分析入門必知:機器學習最通俗的解釋?機器學習
- Nestjs入門學習教程JS
- 聊聊經典機器學習入門機器學習
- 如何入門java(附帶新手推薦學習資料)Java
- 強化學習入門知識與經典專案分析1.3強化學習
- 3月份Github上最熱門的資料科學和機器學習專案TOP7Github資料科學機器學習
- python機器學習速成|1|資料匯入Python機器學習
- 大資料學習路線教程圖,如何快速入門Spark大資料Spark
- 學會這10種機器學習演算法,你才算入門(附教程)機器學習演算法
- 【乾貨】機器學習和深度學習概念入門機器學習深度學習
- 做機器學習專案的checklist機器學習
- [譯] 機器學習專案清單機器學習
- 瀏覽器資料庫 IndexedDB 入門教程瀏覽器資料庫Index
- 機器學習入門實戰疑問機器學習
- 機器學習入門之sklearn介紹機器學習
- Oracle資料庫初學者入門教程Oracle資料庫
- 機器學習之儲存與載入.pickle模型檔案機器學習模型
- 從零開始學機器學習——入門NLP機器學習
- 小資料在機器學習中的重要性機器學習
- 大資料怎樣入門學習?大資料
- 【TVM 學習資料】TensorIR 快速入門