機器學習導圖系列(1):資料處理

caiyongji發表於2019-04-06

機器學習導圖系列教程旨在幫助引導開發者對機器學習知識網路有一個系統的概念,其中具體釋義並未完善,需要開發者自己探索才能對具體知識有深入的掌握。本專案靈感來自Daniel Formoso的github開源專案。本文作者對其專案進行翻譯、整理、批註等二次創作,其中不乏生僻的數學名詞,對於沒有留過學的作者來說費了很多功夫。我又將導圖整理成了知識卡片,方便大家檢視。由於機器學習的知識網路很大,導致完整的導圖過大,文章中的圖片可能經過壓縮,如需完整圖片可檢視github專案machine-learning-mindmap-cn下載高清原圖。本系列還在持續創作中,你的點贊、留言、star都會成為我持續創作的動力。

Daniel Formoso: github.com/dformoso/ma…
machine-learning-mindmap-cn: github.com/caiyongji/m…

機器學習導圖系列分為五大模組。

  1. 機器學習資料處理
  2. 機器學習概念
  3. 機器學習過程
  4. 機器學習演算法
  5. 機器學習模型及神經網路模型

機器學習導圖系列(1):資料處理

資料型別

機器學習導圖系列(1):資料處理

資料探索

機器學習導圖系列(1):資料處理

資料清洗

機器學習導圖系列(1):資料處理

特徵插補

機器學習導圖系列(1):資料處理

特徵工程

機器學習導圖系列(1):資料處理

特徵選擇

機器學習導圖系列(1):資料處理

特徵編碼

機器學習導圖系列(1):資料處理

特徵歸一化(Normalisation)或縮放(Scaling)

機器學習導圖系列(1):資料處理

構造資料集

機器學習導圖系列(1):資料處理

最後

你隨手就是一個贊。

相關文章