2017 年全球範圍內機器學習領域最受歡迎的 10 本書

深度學習世界發表於2018-01-04

640?wx_fmt=jpeg&wxfrom=5&wx_lazy=1

毫無疑問,人工智慧會成為 21 世紀最大的機遇之一,而作為人工智慧的主要領域,機器學習有著廣闊的發展前景,因而程式設計師朋友最好將機器學習作為重點關注方向之一。關於機器學習方面的學習資料,網路上已經很多了,其中書籍是一個很好的選擇。在今年 AI 技術風起雲湧的同時,相關的書籍資料也在不斷出現新成果。專注於科技領域書刊的書籍推薦網站 Toptalkedbooks 最近列出了 2017 年全球範圍內機器學習領域最受歡迎的 10 本書籍,很多人認為這些書在過去一年中對自己研究人工智慧幫助很大。



1. 《Machine Learning For Dummies》





640?wx_fmt=png&wxfrom=5&wx_lazy=1


理解機器學習的使用指南。



對於普通大眾來說,機器學習會是個很難理解的概念,但身處計算機程式設計領域的人卻知道機器學習的寶貴价值。如果沒有機器學習,像欺詐檢測、網路搜尋、網頁實時廣告、信用評分、自動化和垃圾郵件過濾等這些功能都無法有效實現,而且這些也只是機器學習能力的冰山一角。



由資料科學專家 John Paul Mueller 和 Luca Massaron 共同撰寫的這本《 Machine Learning For Dummies 》為任何尋求使用機器學習完成實踐任務的讀者提供了很多切入點。



書中涵蓋了熟悉機器學習基礎概念所需的入門話題,能迅速幫你理解完成機器學習相關任務所需要的程式語言和工具。不管你對機器學習或涉及的數學知識無比抓狂,還是對預處理資料困惑不已,這本書都能讓你很容易地無縫理解和應用機器學習。



  • 理解機器學習怎樣應用在日常活動中。

  • 學習“說”特定的語言,比如Python和R語言,用來教機器執行面向模式的任務和資料分析。

  • 學習用R語言程式設計及使用R Studio。

  • 學習怎樣使用Anaconda以Python程式設計。



本書是機器學習的完全入門指南,是理解機器學習知識的有力武器。



2. 《Machine Learning: The New AI》 (麻省理工出版社基礎知識系列)





640?wx_fmt=jpeg


如今,我們每天使用的大量應用,從產品推薦到語音識別,還有些尚未投入實用的產品比如無人駕駛汽車,這些背後都有機器學習的影子。它是計算領域新方法的基石,在這種新方法中我們不再寫程式而是收集資料,其理念就是從資料中自動學習完成任務所需的演算法。隨著計算裝置越來越強大,我們的生活和工作也會越來越多的以數字化的形式記錄下來,而隨著“大資料”逐漸豐富,機器學習的理念(也是將資料轉變為知識的工作基礎)也同樣不斷進步。

在本書中,機器學習專家 Ethem Alpaydin 就機器學習為普通讀者提供了一個簡潔的概述,描述了機器學習的進化,解釋了重要的機器學習演算法,並列出了機器學習的應用例項。



在當前機器學習蓬勃發展的背景下,Etham Alpaydin 詳細解釋了數字化戰略怎樣從數字演算主機進化到了移動裝置上。他描述了機器學習的基本理論和一些實際應用;機器學習演算法在模式識別方面的應用;受人腦啟發產生的人工神經網路;學習例項之間聯絡的演算法;增強學習等。作者在書中也談及了機器學及“資料科學”這一新興領域的未來發展方向,並討論了保障資料隱私與安全方面的道德及法律問題。



3. 《人工智慧:一種現代的方法(第3版)》(英文版:Artificial Intelligence: A Modern Approach)


640?wx_fmt=jpeg


本書兩位作者 Peter Norvig 和 Stuart J.Russell 均是人工智慧領域的前沿專家。

《人工智慧:一種現代的方法(第3版)》的新版全面而系統地介紹了人工智慧的理論和實踐,闡述了人工智慧領域的核心內容,並深入介紹了各個主要的研究方向。全書分為七大部分:第1部分“人工智慧”,第II部分“問題求解”,第III部分“知識、推理與規劃”,第IV部分“不確定知識與推理”,第V部分“學習”,第VI部分“通訊、感知與行動”,第VII部分“結論”。書中既詳細介紹了人工智慧的基本概念、思想和演算法,還描述了其各個研究方向前沿的進展,同時收集整理了詳實的歷史文獻與事件,很適合想學習 AI 的入門工程師。



本書適合於不同層次和領域的研究人員及學生,是高等院校本科生和研究生人工智慧課的教材,也是相關領域的科研與工程技術人員的重要參考書。



4. Python Machine Learning




640?wx_fmt=jpeg


本書是解鎖機器學習領域深度知識,邁入前沿預測分析的重要指南。



關於本書:


  • 採用了用於深度學、資料整理和資料視覺化的最強大了開源程式庫

  • 學習改進和優化機器學習系統及演算法的有效策略和最佳實踐

  • 強大的統計模型,適用於大部分資料集,能解決你在資料方面的難題



適用哪些讀者?



如果你想學習怎樣用Python解決你在資料方面的重要問題,那就選擇本書吧,不管你是想從零開始還是想擴充套件你在資料科學方面的知識,本書都是一個不容錯過的重要資源。



從書中能學到什麼?


  • 學習怎樣用不同的機器學習模型對資料提出多種問題

  • 學習怎樣用Keras和Theano搭建神經網路

  • 學習怎樣寫出整潔和優雅的Python程式碼,從而將演算法能力最大化

  • 學習如何將機器學習模型嵌入到網路應用中,提升可使用性

  • 使用迴歸分析預測連續性目標輸出

  • 使用資料聚類技術挖掘資料的隱藏模式和結構

  • 使用高效的預處理技術組織資料

  • 學習用情感分析深入詳細瞭解文字及社交媒體資料



機器學習和預測分析正在改變商業等行業的運作模式。能夠理解複雜資料中的趨勢和模式是成功的關鍵,而 Python 能幫你深入瞭解資料,讓你建立複雜的演算法和統計模型,揭示新視角和解答關鍵問題。



本書讓你叩開預測分析的世界,為你展示為何 Python 是當前世界上領先的資料科學語言。如果你想更深入地瞭解資料問題,或者需要改進和延伸自己機器學習系統的能力,這本實操資料科學資料會為你提供莫大的幫助。書中涵蓋了大量強大的 Python 程式庫,包括 scikit-learn,Theano 和Keras 等,幾乎對包括情感分析和神經網路在內的方方面面都提供了指導和建議。



《Python Machine》將機器學習背後的基本原理和理論與實際應用相結合,帶你貫穿 Python 中的重要知識點和其強大的機器學習程式庫,並展示瞭如何應對一些統計模型。



5. Think Bayes: Bayesian Statistics in Python




640?wx_fmt=jpeg


如果你知道怎樣用 Python 程式設計,而且還懂點概率學,那就準備學習貝葉斯統計吧。在本書中,你會學習怎樣用 Python 程式碼而非數學符號解決統計問題,使用概率分佈而非連續數學知識。掌握相關數學知識後,你對貝葉斯的原理會有更清晰的認識,就可以將這些技巧應用於解決實際問題了。



貝葉斯統計方法正變得越來越普遍、越來越重要,但並非所有的知識都適合幫助初學者。作者 Allen Downey 根據自己教授的研究生課程經驗,在書中列出的計算方法能幫你獲得紮實的入門知識。



  • 利用你當前的程式設計技術學習和理解貝葉斯統計

  • 解決估算、預測、決策分析、證明和假設檢驗方面的問題

  • 從簡單的例子著手,比如拋硬幣、巧克力豆、《龍與地下城》骰子、彩彈球和冰球等

  • 學習解決實際複雜問題的計算方法,比如解釋SAT分數、模擬腎部腫瘤和為人體微生物組建模等問題

附:本書英文電子版下載地址

http://greenteapress.com/wp/think-bayes/



6. Data Science from Scratch: First Principles with Python




640?wx_fmt=jpeg


資料科學程式庫、框架、模組和工具包對於從事資料科學工作非常重要,同時也是無需實際理解資料科學就能深入瞭解這門學科的好方法。在這本書中,你會以從零開始應用的方式學習絕大多數最基礎的資料科學工具和演算法。



如果想學習數學知識和一些程式設計技能,作者 Joel Grus 會幫你以輕鬆的方式熟悉資料科學核心部分的數學及統計知識,還有想成為資料科學家所需的計算機技能。



  • Python學習速成

  • 學習線性代數、統計學和概率學的基本知識——理解怎樣和何時將它們應用在資料科學中

  • 收集、探究、清洗、變換和運算元據

  • 深入瞭解機器學習的基礎原理

  • 應用諸如K-最近鄰演算法、樸素貝葉斯、線性和邏輯迴歸、決策樹、神經網路和資料歸類等模型

  • 探究推薦系統、自然語言處理、網路分析、分散式計算和資料庫等知識



7. Make Your Own Neural Network


640?wx_fmt=jpeg


一步步帶你學習神經網路中的數學知識,使用 Python 建立自己的神經網路。

神經網路是深度學習和人工智慧的關鍵元素,但卻很少有人知道真正明白神經網路的工作原理。本書會以有趣的方式,帶你循序漸進地探索神經網路,從非常簡單的理念開始,逐漸建立對神經網路工作原理的理解。讀這本書,高中及以下數學知識就夠用了,而且書裡還包含了微積分的入門知識。



本書的目的是儘可能地讓更多人瞭解神經網路,因為給高階讀者看的書已經夠多了!你會學習用 Python 編碼,建立自己的神經網路,教給它識別人類的手寫數字,也能像專業研發的網路那樣工作。

本書第一部分是理念講解。介紹了神經網路中的數學思想,並輔以大量圖解和例證。



本書第二部分是實踐操作。介紹了學習 Python 的流行和簡單方法,逐漸搭建一個能識別人類手寫數字的神經網路,讓它能像專業人士研發的網路一樣完成任務。



本書第三部分是理念延伸。將搭建的神經網路應用在某個行業中,用你自己的手寫數字測試網路,瞭解神經網路中的祕密,甚至讓搭建的網路在樹莓派上執行。

書中所有的程式碼都已經過測試,可在樹莓派零上執行。



8. Fundamentals of Machine Learning for Predictive Data Analytics: Algorithms, Worked Examples, and Case Studies (麻省理工出版)


640?wx_fmt=jpeg



機器學習常常用於通過從大型資料集中抽取模式來搭建預測模型。這些模型用於預測資料分析應用,包括價格預測、風險評估、預測客戶行為和檔案分類等。本書詳細重點介紹了用於預測資料分析的最重要的機器學習方法,既有理論概念也有實際應用。技術和數學資料部分還補充了說明樣例,以及將這些模型應用於商業中的案例研究。



本書探討了從資料到見解再到決策的過程後,描述了機器學習的四種方式:基於資訊的學習、基於相似的學習、基於錯誤的學習和基於概率的學習。每一方式隱含的概念都以非技術性的解釋進行介紹,並補充了數學模型和演算法。最後,本書研究了用於評估預測模型的技術,並提供了兩個研究案例,描述了整個階段的具體資料分析專案,從用公式表示商業問題到應用分析解決方案。書籍作者有多年的機器學習教學經驗,參與過多個預測資料分析專案,所以特別適合電腦科學、計算機工程、數學及統計學背景的研究生使用。



9. Pattern Recognition and Machine Learning




640?wx_fmt=jpeg



這是第一本用模式識別闡述貝葉斯理論的書,過去五年中,對貝葉斯理論的研究越來越火熱。



本書闡述了近似推理演算法,能提供多種情況下的快速近似答案,而這些情況下精準的答案往往不可行。書中首次提出使用圖解模型描述概率分佈,而市面上尚未有其它書籍在機器學習中應用圖解模型。這也是第一本關於模式識別的四色全綵印刷書。



這本書適用於機器學習、統計學、電腦科學、訊號處理、計算機數視覺、資料探勘等方面的課程。書中還包含超過400項練習,根據難度進行分級,習題答案可從書籍網站上獲取。



10. Machine Learning Yearning





640?wx_fmt=jpeg



AI、機器學習和深度學習正在改變很多行業,但建立一個機器學習系統仍需要你做出務實的決定:

  • 你該收集更多額訓練資料嗎?

  • 你該使用端到端深度學習嗎?

  • 如果訓練集無法匹配測試集,你該怎麼處理?

······

在以往,搞清楚如何做出這些“戰略性”決定的唯一方法就是通過多年的專案實踐慢慢摸索。因此吳恩達寫了這本書,幫助人們快速獲得這個能力,從而能更好地建立AI系統。



注:去吳恩達的網站 http://www.mlyearning.org/ 可用郵箱免費獲取本書電子版。

640?wx_fmt=jpeg0?wx_fmt=gif

640?wx_fmt=png

點選下方“閱讀原文”下載【同聲譯】↓↓↓

相關文章