機器學習知識體系 (強烈推薦)

大資料週刊發表於2018-06-14

隨著2016年Alpha Go在圍棋擊敗李世石,2017年初卡內基梅隆大學人工智慧系統Libratus在長達20天的鏖戰中,打敗4名世界頂級德州撲克玩家,這標誌著人工智慧技術又達到了一個新的高峰。


640?wx_fmt=jpeg


人工智慧已經不再是在各大公司幕後提供各種智慧推薦、語音識別演算法的工具,它已經慢慢走向臺前進入到平常百姓的視野之中。


曾經有人描述人工智慧就向一列緩緩開向人們的火車,一開始非常遙遠而且看起來非常緩慢,它慢慢接近,直到人們清楚看到它的時候,它已經呼嘯而過,把人遠遠拋在身後。現在似乎就是人們可以遠遠看到人工智慧的時候,它已經發展數十年,但直到最近才引起廣泛注意,隨著大資料的積累、演算法的改進、硬體的提升,人工智慧可以在很多細分的領域成為專家,輔助人類甚至超過人類。


接觸一個領域的第一步是儘快的瞭解全貌並且搭建出相應的知識體系。大致提綱如下(後續不斷補充):


1-數學


線性代數、微積分


在整個機器學習過程中涉及大量矩陣運算和微積分導數的概念,因此建議初學者至少要有較為紮實的數學基礎,對矩陣和微積分的概念瞭解比較清楚。否則在一些公式推導過程中會遇到較大障礙,而不斷反覆回來複習數學知識。


2-程式語言


Python/R/Java/Matlab


Python已經成為機器學習的第一語言,至於為什麼知乎(https://www.zhihu.com/question/30105838?sort=created)中有非常不錯的解釋。眾多機器學習的框架都支援PythonAPI,所以學習機器學習,Python語言語法估計是繞不過去。


3-Superviselearning


Linearregression


Logisticregression


Neuralnetwork


SVM


監督學習指的是人們給機器一大堆標記好的資料,比如一大堆照片,標記出哪些是貓的照片,哪些不是,然後讓機器自己學習歸納出演算法,可以判斷出其他照片是否是貓。目前這個領域演算法代表:


Linearregression,Logisticregression,Neuralnetwork,SVM等等。


4-Unsuperviselearning


K-means


PCA


Anomalydetection


非監督學習指的就是人們給機器一大堆沒有標記的資料,讓機器可以對資料進行分類、檢測異常等。


5-Specialtopic


Recommendsystem


Largescalemachinelearningapplication


一些特殊演算法,例如推薦系統。常用於購物網站,可以根據你的過往購物或評分情況,來向你推薦商品。


6-Adviceonmachinelearning


Bias/vairance


Regulation


Learningcurve


Erroranalysis


Cellinganalysis


機器學習的建議,包含引數正則化、學習曲線、錯誤分析、調參等。


7-DeepLearning


NeuralNetwotk


深度學習是近期機器學習的一個熱門分支,模擬人類大腦的思維方式,可以極大的提高正確率,是近來機器學習的一個非常大的突破。


8-Tools/Framework


TensorFlow/Theano/Keras


很多大廠就開源了一些機器學習的框架,基於這些框架可以很容易搭建機器學習的平臺。


推薦的學習資料:


Github上面有一份非常詳盡的學習路徑(https://github.com/JustFollowUs/Machine-Learning)


我個人推薦的幾個經典資料:


機器學習


AndrewNG的Coursera的機器學習入門(https://www.coursera.org/learn/machine-learning):這個教程非常適合初學者,沒有很高深的數學推導,Andrew也是業內大牛但非常謙遜,講解非常淺顯易懂。


周志平的機器學習(https://book.douban.com/subject/26708119/):號稱最好的中文機器學習入門,這裡有對這本書的詳細評(https://www.zhihu.com/question/39945249)。


幾本經典著作:AnIntroductiontoStatisticalLearning,PatternRecognitionandMachineLearning,TheElementsofStatisticalLearning


深度學習


NeuralNetworksandDeepLearning:MichaelNielsen用非常淺顯易懂的方式介紹了神經網路和深度學習,並且提供了一個手寫數字識別的例子,非常適合入門。


UFLDLTutorialIUFLDLTutorialII:AndrewNG主導的DeepLearning的學習資料,內容非常精煉,適合稍微有些基礎的同學。


DeepLearning:幾位大神共同編寫的關於深度學習的freebook。


從人工智慧到機器學習,再到最近大熱的深度學習,人們已經在這個領域研究了數十年,現在雖然取得一定的突破,但是離真正的人工智慧還有非常長的距離。而且人工智慧一定要跳出學術界的研究框架,結合工業界的應用,從2016年可以看到大量的實際應用場景,例如自動駕駛、AppleSiri、AmazonEcho、谷歌翻譯等等,我相信未來人工智慧領域極有可能成為下一代顛覆性的技術革命。


來源:奶爸碼農


640

大資料週刊

郵箱:tougao@bigdatamag.cn

電話:010-57524293


640

眾論大資料 引領大時代

長按二維碼關注


相關文章