如何自學人工智慧？

景略集智發表於2018-05-22

歡迎關注我們，AI教程、學習資源、趣味科普、論文解讀，你想看的都在這裡！

最近不少同學躍躍欲試，想投入 AI 的懷抱，但苦於不知如何下手。其中，人工智慧的核心就是機器學習（Machine Learning），它是使計算機具有智慧的根本途徑，其應用遍及人工智慧的各個領域。

我們今天就來分享一篇來自 EliteDataScience 上專門講給機器學習入門自學者的教程，一步步教你如何從基礎小白進階為 ML 大拿。快上車吧，別找硬幣了，這趟車不要錢！

你是否正在準備自學機器學習，但又不知道怎麼去學？

今天我們在這篇文章裡就教你怎樣免費獲得世界級的機器學習教育，你既不需要有博士學位，也不必是技術大牛。不管你是想成為資料科學家還是在開發中使用機器學習演算法，其實你都能比想象中更快地學習和應用機器學習。

本文告訴你在機器學習之路上的幾個步驟，保你不會迷路，下面開始我們的表演。

在悶頭學習機器學習之前，最好先把什麼是機器學習搞清楚，瞭解機器學習的基本概念。

簡單來說，機器學習就是教電腦怎樣從資料中學習，然後做出決策或預測。對於真正的機器學習來說，電腦必須在沒有明確程式設計的情況下能夠學習識別模型。

機器學習屬於電腦科學與統計學的交叉學科，在多個領域會以不同的面目出現，比如你應該聽過這些名詞：資料科學、大資料、人工智慧、預測型分析、計算機統計、資料探勘······

雖然機器學習和這些領域有很多重疊的地方，但也不能將它們混淆。例如，機器學習是資料科學中的一種工具，也能用於處理大資料。

機器學習自身也分為多個型別，比如監督式學習、非監督式學習、增強學習等等。例如：

郵件運營商將垃圾廣告資訊分類至垃圾箱，應用的是機器學習中的監督式學習；電商公司通過分析消費資料將消費者進行分類，應用的是機器學習中的非監督式學習；而無人駕駛汽車中的電腦合攝像頭與道路及其它車輛互動、學習如何導航，就是用到了增強學習。

想了解機器學習的入門知識，可以看看一些網路課程。對於想對機器學習領域的重點慨念有個基礎的瞭解的人來說，吳恩達教授的機器學習入門課程絕對必看：戳這裡。

以及“無人車之父” Sebastian Thrun 的《機器學習入門》課程，對機器學習進行了詳細介紹，並輔以大量的程式設計操作幫助你鞏固所學內容：戳這裡。

當然也少不了集智君整理製作的免費專欄，在這裡你可以免去安裝環境的煩惱，直接投入簡單地機器學習訓練中來：

這些課程都是免費的哦！

大概瞭解機器學習後，我們就來到知識準備階段了。

如果沒有基本的知識儲備，機器學習的確看起來很嚇人。要學習機器學習，你不必是專業的數學人才，或者程式設計師大牛，但你確實需要掌握這些方面的核心技能。

好訊息是，一旦完成預備知識，剩下的部分就相當容易啦。實際上，機器學習基本就是將統計學和電腦科學中的概念應用在資料上。

這一步的基本任務就是保證自己在程式設計和統計學知識上別掉隊。

2-1：用於資料科學中的Python程式設計

如果不懂程式設計，是沒法使用機器學習的。幸好，這裡有份免費教程，教你如何學習應用於資料科學中的Python語言：戳這裡。

注：景略集智再補充三個資源：

2-2：用於資料科學的統計學知識

瞭解統計學知識，特別是貝葉斯概率，對於許多機器學習演算法來說都是基本的要求。這裡有份學習資料學習中統計學知識的教程：戳這裡。

2-3：需要學習的數學知識

研究機器學習演算法需要一定的線性代數和多元微積分知識作為基礎。點這裡，獲取一份免費學習教程：戳這裡。

所謂“海綿模式”，就是像海綿吸水一樣，儘可能多地吸收機器學習的原理和知識，這一步和第一步有些相似，但不同的是，第一步是對機器學習有個初步瞭解，而這一步是要掌握相關原理知識。

可能有些同學會想：我又不想做基礎研究，幹嘛要掌握這些原理，只要會用機器學習工具包不就行了嗎？

有這個疑問也很正常，但是對於任何想將機器學習應用在工作中的人來說，學習機器學習的基礎知識非常重要。比如你在應用機器學習中可能會遇到這些問題：

資料收集是個非常耗時耗力的過程。你需要考慮：我需要收集什麼型別的資料？我需要多少資料？等此類的問題。
資料假設和預處理。不同的演算法需要對輸入資料進行不同的假設。我該怎樣預處理我的資料？我的模型對缺失的資料可靠嗎?
解釋模型結果。說機器學習就是“黑箱”的觀點明顯是錯誤的。沒錯，不是所有的模型結果能直接判讀，但你需要能夠判斷模型的狀況，進而完善它們。我怎麼確定模型是過度擬合還是不充分擬合？模型還有多少改進空間？
優化和除錯模型。很少有人剛開始就得到一個最佳模型，你需要了解不同引數之間的細微差別和正則化方法。如果我的模型過度擬合，該怎麼修正？我應該將幾個模型組合在一起嗎？