機器學習入門知識體系

IT派發表於2018-01-07

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

IT派 - {技術青年圈}持續關注網際網路、大資料、人工智慧領域關注


往期精彩回顧640?wx_fmt=png&wxfrom=5&wx_lazy=1

  重大改變!Excel即將接入Python!辦公軟體也要革命

入門十大Python機器學習演算法(附程式碼)

女博士實名舉報長江學者陳小武性騷擾女學生

640?wx_fmt=png&wxfrom=5&wx_lazy=1

隨著2016年Alpha Go在圍棋擊敗李世石,2017年初卡內基梅隆大學人工智慧系統Libratus在長達20天的鏖戰中,打敗4名世界頂級德州撲克玩家,這標誌著人工智慧技術又達到了一個新的高峰。人工智慧已經不再是在各大公司幕後提供各種智慧推薦、語音識別演算法的工具,它已經慢慢走向臺前進入到平常百姓的視野之中。曾經有人描述人工智慧就向一列緩緩開向人們的火車,一開始非常遙遠而且看起來非常緩慢,它慢慢接近,直到人們清楚看到它的時候,它已經呼嘯而過,把人遠遠拋在身後。現在似乎就是人們可以遠遠看到人工智慧的時候,它已經發展數十年,但直到最近才引起廣泛注意,隨著大資料的積累、演算法的改進、硬體的提升,人工智慧可以在很多細分的領域成為專家,輔助人類甚至超過人類。


作為一名初學者,我也是剛剛接觸人工智慧和機器學習,希望能夠和大家共同學習。接觸一個領域的第一步是儘快的瞭解全貌並且搭建出相應的知識體系。大致提綱如下(後續不斷補充):

640?wx_fmt=png&wxfrom=5&wx_lazy=1

1 - 數學


線性代數、微積分


在整個機器學習過程中涉及大量矩陣運算和微積分導數的概念,因此建議初學者至少要有較為紮實的數學基礎,對矩陣和微積分的概念瞭解比較清楚。否則在一些公式推導過程中會遇到較大障礙,而不斷反覆回來複習數學知識。

 

2 - 程式語言


Python/R/Java/Matlab  7 Steps to Mastering Machine Learning With Python(http://www.kdnuggets.com/2015/11/seven-steps-machine-learning-python.html


Python已經成為機器學習的第一語言,至於為什麼知乎(https://www.zhihu.com/question/30105838?sort=created)中有非常不錯的解釋。眾多機器學習的框架都支援Python API,所以學習機器學習,Python語言語法估計是繞不過去。


3 - Supervise learning


Linear regression:機器學習知識體系 - 線性迴歸(http://www.cnblogs.com/wdsunny/p/6362582.html


Logistic regression: 機器學習知識體系 - 邏輯迴歸(http://www.cnblogs.com/wdsunny/p/6369916.html


Neural network:機器學習知識體系 - 神經網路(基礎)(http://www.cnblogs.com/wdsunny/p/6399572.html)  機器學習知識體系 - 神經網路(反向傳播演算法)(http://www.cnblogs.com/wdsunny/p/6399623.html


SVM:SVM支援向量機(http://mp.weixin.qq.com/s/Uha_MJQtJiWRhBuVW32y9g) SVM支援向量機(http://www.jianshu.com/p/e22381cc2e38) SVM - Understanding the math(http://www.svm-tutorial.com/2014/11/svm-understanding-math-part-1/


監督學習指的是人們給機器一大堆標記好的資料,比如一大堆照片,標記出哪些是貓的照片,哪些不是,然後讓機器自己學習歸納出演算法,可以判斷出其他照片是否是貓。目前這個領域演算法代表:Linear regression, Logistic regression, Neural network, SVM等等。 

 

4 - Unsupervise learning


K-means:深入淺出K-Means演算法(http://www.csdn.net/article/2012-07-03/2807073-k-means


PCA:主成份分析演算法 PCA(http://blog.kamidox.com/pca.html


Anomaly detection:異常檢測(http://blog.kamidox.com/gaussian-distribution.html


非監督學習指的就是人們給機器一大堆沒有標記的資料,讓機器可以對資料進行分類、檢測異常等。

 

5 - Special topic


Recommend system


Large scale machine learning application


一些特殊演算法,例如推薦系統。常用於購物網站,可以根據你的過往購物或評分情況,來向你推薦商品。

 

6 - Advice on machine learning


Bias/vairance:Understanding the Bias-Variance Tradeoff(http://scott.fortmann-roe.com/docs/BiasVariance.html


Regulation


Learning curve


Error analysis:Accurately Measuring Model Prediction Error(http://scott.fortmann-roe.com/docs/MeasuringError.html


Celling analysis


機器學習的建議,包含引數正則化、學習曲線、錯誤分析、調參等。

 

7 - Deep Learning


Neural Netwotk


深度學習是近期機器學習的一個熱門分支,模擬人類大腦的思維方式,可以極大的提高正確率,是近來機器學習的一個非常大的突破。


CNN:卷積神經網路全面解析(http://www.moonshile.com/post/juan-ji-shen-jing-wang-luo-quan-mian-jie-xi)   零基礎入門深度學習(4) - 卷積神經網路(https://zybuluo.com/hanbingtao/note/485480

8 - Tools/Framework


TensorFlow/Theano/Keras


很多大廠就開源了一些機器學習的框架,基於這些框架可以很容易搭建機器學習的平臺。


TensorFlow and Deep Learning without a PhD, Part 1(https://www.youtube.com/watch?v=u4alGiomYP4


TensorFlow and Deep Learning without a PhD, Part 2(https://www.youtube.com/watch?v=fTUwdXUFfI8

 

推薦的學習資料:


Github上面有一份非常詳盡的學習路徑(https://github.com/JustFollowUs/Machine-Learning) awesome-deep-learning(https://github.com/ChristosChristofidis/awesome-deep-learning


我個人推薦的幾個經典資料:


機器學習 


Andrew NG的Coursera的機器學習入門(https://www.coursera.org/learn/machine-learning):這個教程非常適合初學者,沒有很高深的數學推導,Andrew也是業內大牛但非常謙遜,講解非常淺顯易懂。


Neural Networks for Machine Learning(https://class.coursera.org/neuralnets-2012-001) by Geoffrey Hinton in Coursera (2012)


周志華的機器學習(https://book.douban.com/subject/26708119/):號稱最好的中文機器學習入門,這裡有對這本書的詳細評價(https://www.zhihu.com/question/39945249)。


幾本經典著作:An Introduction to Statistical Learning(http://www-bcf.usc.edu/~gareth/ISL/),Pattern Recognition and Machine Learning(https://www.amazon.com/Pattern-Recognition-Learning-Information-Statistics/dp/0387310738/ref=pd_sim_14_1?ie=UTF8&dpID=61f0EXfMRvL&dpSrc=sims&preST=_AC_UL160_SR118%2C160_&refRID=119X50P5F0DFA339S9DR),The Elements of Statistical Learning(https://www.amazon.com/The-Elements-Statistical-Learning-Prediction/dp/0387848576/ref=pd_sim_14_2?ie=UTF8&dpID=41LeU3HcBdL&dpSrc=sims&preST=_AC_UL160_SR103%2C160_&refRID=119X50P5F0DFA339S9DR

 

深度學習


Neural Networks and Deep Learning(http://neuralnetworksanddeeplearning.com/index.html):Michael Nielsen(http://michaelnielsen.org/)用非常淺顯易懂的方式介紹了神經網路和深度學習,並且提供了一個手寫數字識別的例子,非常適合入門。


UFLDL Tutorial I(http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial) UFLDL Tutorial II(http://ufldl.stanford.edu/tutorial/):Andrew NG主導的Deep Learning的學習資料,內容非常精煉,適合稍微有些基礎的同學。


Deep Learning(http://www.deeplearningbook.org/):幾位大神共同編寫的關於深度學習的free book。


零基礎入門深度學習(https://zybuluo.com/hanbingtao/note/433855):一位大神寫的關於深度學習的入門教程,由淺入深的詳細介紹了深度學習的幾個重要內容,非常適合入門的學習。


Convolutional Neural Networks for Visual Recognition - Stanford(http://vision.stanford.edu/teaching/cs231n/syllabus_winter2015.html) by Fei-Fei Li, Andrej Karpathy (2015)


Convolutional Neural Networks for Visual Recognition - Stanford(http://vision.stanford.edu/teaching/cs231n/syllabus.html) by Fei-Fei Li, Andrej Karpathy (2016)


Deep Learning Course(https://www.college-de-france.fr/site/en-yann-lecun/course-2015-2016.htm) by Yann LeCun (2016)

 

從人工智慧到機器學習,再到最近大熱的深度學習,人們已經在這個領域研究了數十年,現在雖然取得一定的突破,但是離真正的人工智慧還有非常長的距離。而且人工智慧一定要跳出學術界的研究框架,結合工業界的應用,從2016年可以看到大量的實際應用場景,例如自動駕駛、Apple Siri、Amazon Echo、谷歌翻譯等等,我相信未來人工智慧領域極有可能成為下一代顛覆性的技術革命。


出處:https://www.cnblogs.com/wdsunny/p/6362044.html


版權申明:內容來源網路,版權歸原創者所有。除非無法確認,我們都會標明作者及出處,如有侵權煩請告知,我們會立即刪除並表示歉意。謝謝。

-END-


0701  Sun

IT派會持續關注網際網路、大資料、機器學習和人工智慧領域,歡迎加入IT派-{ 技術青年圈 },希望大家更多參與到相互學習交流的過程中,掃描二維碼備註IT派進群交流 。

  IT派0?wx_fmt=png

0?wx_fmt=jpeg0?wx_fmt=gif閱讀原文,有資源共

相關文章