機器學習該怎麼入門?

千鋒教育官方部落格發表於2017-09-01

在說該怎麼入門之前,我們們應該瞭解一下什麼是機器學習。機器學習也叫資料探勘、模式識別,其定義很多。

簡單地說,機器學習要做的就是,現在有些資料(比如你人人網好友和他們的發言),我們要對資料進行處理,希望從資料中得到我們想要的資訊(比如這些好友哪些和你投緣)。由此我們可以看出機器學習其實是對人類智慧的模仿,也是實現人類和更高智慧的必經之路。

機器學習這個概念認為,對於待解問題,你無需編寫任何專門的程式程式碼,泛型演算法(generic algorithms)能夠在資料集上為你得出有趣的答案。對於泛型演算法,不用編碼,而是將資料輸入,它將在資料之上建立起它自己的邏輯。

舉個例子,有一類演算法稱為分類演算法,它可以將資料劃分為不同的組別。一個用來識別手寫數字的分類演算法,不用修改一行程式碼,就可以用來將電子郵件分為垃圾郵件和普通郵件。演算法沒變,但是輸入的訓練資料變了,因此它得出了不同的分類邏輯。

好了,說了這麼多,該開始講重點了:機器學習到底該怎麼入門?

第一,找個專案或者找一門稍微具體點的關於機器學習的書。開始深入研究。機器學習應用只是一方面,要想明白透徹,還得整明白這一個個模型背後的故事。

第二,去Coursera上Andrew Ng的《機器學習》,完成所有作業,最好能全部拿滿分。這是相當入門的課程。

課程深入淺出,而且作業也非常適合入門者,都是設計好的程式框架,有作業指南,根據作業指南填寫該完成的部分就行。這門課上完了,你基本上可以開始簡單地應用各種機器學習技術了。

第三,修煉內功。話說自己發現光應用不行,還得整明白其背後的東東後,就想四處找人請教,到哪兒去學高階的內功呢?看看這份清單(微博上發現的):




聽說這是機器學習教父級別的人物Jordan推薦的書籍,而且全部都是值得珍藏的!這些資料大多都可以在百度裡搜到。如果搜尋不到大家也可以去新浪微博找那些搞機器學習的人尋求幫助,他們會很熱心的。

說完入門學習,如果你還想進行深入學習機器學習,看看應該怎麼做:

當前機器學習的最大問題是它主要活躍於學術界和商業研究組織中。對於圈外想要有個大體瞭解而不是想成為專家的人們,簡單易懂的學習資料不多。但是這一情況每一天都在改善。

你可以下載安裝SciKit-Learn,用它來試驗成千上萬的機器學習演算法。它是一個python框架,對於所有的標準演算法都有“黑盒”版本。

看看機器學習概要圖 by Yaser Abu-Mostafa (Caltech)


差不多就是這樣了。最後說幾句心裡話,不管你學習哪一門新科目,都不是一帆風順的。還有,重要的是你的決心,你到底要不要學這門學科!你要是抱著半吊子的心態,那你可以不用看了,因為半吊子的決心學不明白任何一門學科!你要是想學,就咬緊牙,堅持看,反覆看,反覆查以及多動手。


相關文章