理論部分
以下都是機器學習的基礎教材。如果你認真研讀其中任意一本,這意味著你要分析其中的模型,推導和實現主推理演算法並進行練習,這些教材可以為你提供堅實的背景。如果你是機器學習的入門菜鳥,這些書可能技術性很強,但是一旦你堅持完成其中一本,你會發現其他教材也變得簡單易懂。
1. 統計學習精要(The Elements of Statistical Learning (ESL))
作者:Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie
推薦語:經典之作!!這同時也是一個線上課程,新版教材提供R程式碼
2. 模式識別與機器學習(Pattern recognition and machine learning (PRML))
作者:Christopher Bishop
推薦語:和ESL一樣,這本也是必讀之作。
3. 機器學習:概率學觀點(Machine Learning: A Probabilistic Perspective)
作者:Kevin R Murphy
推薦語:如果你徹底學習(前文)PRML,你能掌握這本書中的大部分內容。 然而,這是一本有趣而全面的書,主要關注有原則的、概率性的建模方法。 它還附帶Matlab中的程式碼。
4. 概率圖模型(Probabilistic Graphical Models)
作者:Daphne Koller and Nir Friedman
推薦語:圖模型為概率模型的表示、推理以及學習提供了框架。這個強大的框架為許多機器學習模型提供了巨集觀視角,否則這些模型僅僅被看作一堆不同的模型。書還配有Coursera的線上課程。
5. 強化學習(Reinforcement learning, an introduction)
作者:Richard S. Sutto and Andrew G. Barto
推薦語:儘管這本書還是一個初稿,但第二個版本已經寫得很好,並且很好地解釋了強化學習的概念和應用。
6. 神經網路與深度學習(Neural networks and deep learning)
作者:Michael Nielsen
推薦語:Michael Nielsen的書更加實用,包含一些很酷的互動內容以幫助理解
7. 深度學習(Deep Learning)
作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville
推薦語:相比上面Michael Nielsen書的實用性,本書則更全面。我建議按照給定的順序閱讀學習。
應用部分
1. 商業中的資料科學(Data science for business)
作者:Foster Provost and Tom Fawcett
推薦語:本書對非技術人員(如業務經理)非常友好。它還提供了有關如何執行資料科學專案的一些合理原則。強烈推薦此書!!
2. R資料科學(R for data science)
作者:Garrett Grolemund and Hadley Wickham
推薦語:特別是對R使用者來說,這本是必讀教材。
3. 應用預測建模(Applied predictive modelling)
作者:Kjell Johnson and Max Kuhn
推薦語:由非常流行的R包caret的作者撰寫,也是一本必讀教材。 它包含許多實用技巧和建議,不僅可用於建模,還可用於不同模型的資料準備。
4. 資料科學技術:市場營銷、銷售與客戶關係管理領域(Mining Techniques: For Marketing, Sales, and Customer Relationship)
作者:Gordon S. Linoff and Michael J. A. Berry
推薦語:不要被標題誤導,書中的資料科學技術普遍適用,不僅僅是對客戶關係管理(CRM)。
5. 資料探勘的資料準備(Data preparation for data mining)
作者:Dorian Pyle
推薦語:1999年出版,但今天仍然非常適用,本書提供了一個明細的清單,以便在準備分析資料時進行檢查。
6. 網站優化的Bandit 演算法(Bandit algorithms for website optimization)
作者:John Myles White
推薦語:本書介紹了標準的多臂賭博機演算法(multi-armed bandit),並提供了多種語言的實現。
7. R資料科學實戰手冊(Practical data science with R)
作者:John Mount and Nina Zumel
推薦語:此書不像Johnson和Kuhn的書那樣精緻,但還是有一些值得了解的技巧。
原文標題:
Data science books - theory and practice
原文連結:
https://www.codementor.io/trungnguyen958/data-science-books-theory-and-practice-krrjgncy7
譯者簡介
王雨桐,統計學在讀,資料科學碩士預備,跑步不停,彈琴不止。夢想把資料視覺化當作藝術,目前日常是摸著下巴看機器學習。