大學渣的ISLR筆記(1)

weixin_34050427發表於2016-08-09

從5月份開始對統計學習(機器學習)感興趣,一路走過來也算是剛剛入門了。基本上可以講清楚什麼是機器學習、深度學習、資料探勘,用前人積累的庫和框架也可以解決實際工程中的統計學問題。給我一個方向和資料,也可以用python來實現資料的ETL,應用ML演算法,給出結論。

之前一直搞工程,對理論和數學的理解太淺了,現在準備啃ISLR《An Introduction to Statistical Learning》和ESL《The Elements of Statistical Learning》兩本書。機器學習不易,看好AI和AR的未來就不能放棄,且學且珍惜。

在開始讀ISLR之前,把這3個月的學習路徑總結一下。

最開始看的書是《集體智慧程式設計》,這本書內容比較陳舊,前5章可讀性非常強,讀完你會有一個概念:有一種之前我從沒有涉及過的學科在影響著大規模WEB應用,這些集體智慧(演算法)來自於機器學習和統計學領域。


2374664-4366822407498e80.jpg

第二本書:《統計學的世界》,這本書已經絕版了,在淘寶上買的影印版,這本書不用高等數學知識,僅僅用例子就可以讓你入門統計學。


2374664-680856037fe06b1e.jpg

第三本書:《普林斯頓微積分讀本》大學渣需要撿起微積分,這本書也絕版了。


2374664-1aeb9528112c455a.jpg

第四、五本書:《概率統計》《線性代數》大學渣需要撿起概率&線性代數。


2374664-70ad355c70f699a6.jpg

第六本書:《利用Python進行資料分析》這本書其實是pandas的工具書,用python搞統計必讀。


2374664-de8e34704ab31411.jpg

第七、八本書:《貝葉斯思維》《統計思維》這兩本書用python講統計,實用性強。


2374664-8dea37d26e7514d3.jpg
2374664-642bcd8f11382dba.jpg

第九本書:《資料探勘導論》一本無需太多數學知識就可以系統學習分類、聚類、關聯分析、異常檢測等常用ML演算法。


2374664-c380d7b6392321e0.jpg

第十、十一本書:《Hadoop權威指南》《Spark快速大資料分析》看這兩本是為了瞭解如何使用大資料分析平臺來搭建大資料機器學習系統。


2374664-40e3287b892c558c.jpg
2374664-d7c28140ebe5b427.jpg

第十二本書:《Python資料探勘入門與實踐》這是一本scikit-Learn入門書,站在前人肩膀上,你利用scikit-Learn可以很容易分析資料(演算法都實現好了),利用一些DL框架進行深度學習也不是難事,這是一本實踐性很強的書,但僅僅只是入門,太太太淺了。


2374664-dc0fb6202c61d1cf.jpg

相關文章