機器學習和資料科學領域必讀的10本免費書籍

暖夏未眠丶發表於2018-06-19

摘要:
暑期來了,別出去溜達了,看書學習一波~

在這個暑假,有興趣的可以閱讀一下這些免費的有關機器學習和資料科學的書籍,他們能給你開啟一扇看清機器學習和資料科學的窗。如果在閱讀完這一文章後想知曉更多免費的好書,請檢視本系列的前一篇或下面的相關內容。

50094ef6262598a8a6abe86c76df94c3c25b4f9a

1. Python Data Science Handbook

作者:Jake VanderPlas

本書介紹了在Python中處理資料所必需的核心庫,特別是IPythonNumPyPandasMatplotlibScikit-Lean和相關的軟體包。在此之前您需要掌握Python這種語言,如果您想快速掌握這門語言,可以參閱這個針對研究人員和科學家的Python語言快速入門的“Python的旋風之旅(A Whirlwind Tour of Python)”。

2. Neural Networks and Deep Learning

作者:Michael Nielsen

這是一本免費的線上書籍。通過這本書你會知道神經網路是一個美麗的生物啟發式程式設計範例,使計算機可以從觀測資料中學習。而深度學習則是一套強大的神經網路學習技術。

目前,神經網路和深度學習為影象識別、語音識別和自然語言處理(NLP)中的問題提供了很多效果不錯的解決方案。通過這本書您將會知道更多神經網路和深度學習背後的核心概念。

3. Think Bayes

作者:Allen B.Downey

這本書主要介紹瞭如何使用計算方法處理貝葉斯統計

如果您想使用本書中的技能來學習其他技能,您需要知道如何程式設計。

貝葉斯統計是根據數學概念(如微積分)提出的,有關它的大多數書籍也都使用的是數學符號。本書使用Python程式碼而不是數學,因此“積分”變成了“總和”。這是書中的一個特色。

4. Machine Learning & Big Data

作者:Karee Alkaseer

這本書背後的目的是為了讓軟體工程師在不依賴庫的情況下可以輕鬆使用機器學習模型。大多數情況下,模型或技術背後的概念很簡單、直觀,但在細節或行話中會丟失。另外,一般情況下,現有的庫可以解決手頭的問題,但是有時候它們會用自己的方式抽象和隱藏基本概念,這就是它們被稱為“黑盒子”的原因。這本書也嘗試著將“黑盒子”裡被抽象和隱藏的基本概念清晰化。它是一個還在進行中的作品,它的內容將慢慢的豐富。

5. Satistical Learning with Sparsity:The Lasso and Generalizations

作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright

在過去的十年中,計算和資訊科技得到了迅猛發展。隨著它的應用,在醫學、生物學、金融和市場營銷等領域中湧現出了大量的資料。本書在一個共同的概念框架下,闡述了這些領域中的一些重要觀點。

6. Statistical inference for data science

作者:Brian Caffo

作為資料科學專業的一部分 ,本書是統計推理課程(Statistical Inference)的一本配套書籍。如果你沒有上這門課,也可以配著YouTube上有關視訊單獨學習這本書。

本書旨在以低成本介紹統計推理這一重要領域,使得具有程式設計能力的學生將這些技能用到資料科學或統計學當中去。

7. Convex Optimization

作者:Stephen Boyd & Lieven Vandenberghe

這本書的主要內容是關於凸優化(convex optimization),這是一類特殊的數學優化問題,它包括最小二乘和線性規劃問題。眾所周知,最小二乘和線性規劃問題有一個相當完整的理論,出現在各種應用中,並且可以非常有效地用數值求解。本書的基本觀點是,對於較大類的凸優化問題也可以如此。

8. Natural Language Processing with Python

作者:Steven Bird & Ewan Klein & Edward Loper

本書基於Python程式語言和一個叫自然語言工具包(NLTK)的開源庫寫作而成的。“自然語言”是指用於人類日常交流的語言,與程式語言和數字符號等語言不同,自然語言在代代相傳的過程中不斷髮展,並且很難用明確的規則來確定。為了讓計算機更好地理解自然語言,我們開發運用了自然語言處理(NLP)。這本書就是有關自然語言處理(NLP)的書。

9. Automate the Boring Stuff with Python

作者:AI Sweigart

你是否有過為花費數小時為檔案重新命名或更新表格裡的數百個單元格而煩躁的經歷?在這本書中,你將會學到如何使用Python來輕鬆搞定這些問題。Python十分好上手,一旦掌握了程式設計的基礎知識,就可以建立Python程式,就此輕鬆解決那些繁瑣的事情。

10.Social Media Mining: An Introduction

作者:Reza Zafarani & Mohammad Ali Abbasi & Huan Liu

社交媒體在過去十年的發展已經徹底革新了個人互動和行業開展業務的方式。個人通過社交媒體互動、共享產生了大量的資料。

在這本書中,你將瞭解到社交媒體挖掘(Social Media Mining)整合了社交媒體,社交網路分析和資料探勘,為學生、從業人員、研究人員等提供了一個方便而一致的平臺。同時也將會了解到社交媒體挖掘(Social Media Mining)的潛力。

本文由北郵@愛可可-愛生活 老師推薦,阿里云云棲社群組織翻譯。

文章原標題《10 More Free Must-Read Books For Machine Learning and Data Science》

作者:Matthew Mayo

譯者:烏拉烏拉,審校:袁虎。

原文連結


相關文章