《Spark 3.0大資料分析與挖掘:基於機器學習》簡介
# 好書推薦 ## 好書奇遇季 # 《 Spark 3.0 大資料分析與挖掘:基於機器學習》,京東噹噹天貓都有發售。 Spark 作為新興的、應用範圍廣泛的大資料處理開源框架,吸引了大量的大資料分析與挖掘從業人員進行相關內容的學習與開發,其中 ML 是 Spark 3.0 機器學習框架使用的核心。本書用於 Spark 3.0 ML 大資料分析與挖掘入門,本書配套示例原始碼、 PPT 課件、資料集與答疑服務。
本書內容
本書共分 13 章,從 Spark 3.0 大資料分析概述、基礎安裝和配置開始,依次介紹 ML 的 DataFrame 、 ML 的基本概念,以及協同過濾、線性迴歸、分類、決策樹與隨機森林、聚類、關聯規則、資料降維、特徵提取和轉換等資料處理方法;最後透過經典的鳶尾花分析例項,回顧前面的學習內容,實現了一個完整的資料分析與挖掘過程。
本書特點
( 1 )本書儘量避免純粹的理論知識介紹和高深技術研討,完全從應用實踐出發,用最簡單、典型的示例引申出核心知識,最後指出通往 “ 高精尖 ” 進一步深入學習的道路。
( 2 )本書全面介紹 ML 涉及的資料探勘的基本結構和上層程式設計,藉此能夠系統地看到 ML 的全貌,使讀者在學習過程中不至於迷失方向。
( 3 )本書在寫作上淺顯易懂,沒有深奧的數學知識,採用較為簡潔的形式描述應用的理論知識,讓讀者輕鬆愉悅地掌握相關內容。
( 4 )本書旨在引導讀者進行更多技術上的創新,每章都會用示例描述的形式幫助讀者更好地學習內容。
( 5 )本書程式碼遵循重構原理,避免程式碼汙染,引導讀者寫出優秀、簡潔、可維護的程式碼。
( 6 )本書所有資料格式均為 DataFrame 型別,並且使用管道技術執行機器學習演算法。
本書讀者
本書適合 Spark 3.0 機器學習初學者、大資料分析和挖掘人員,也適合高等院校和培訓機構人工智慧與大資料相關專業的師生教學參考。
本書作者
王曉華,計算機專業講師,研究方向為雲端計算、大資料與人工智慧。著有圖書《 Spark 3.0 大資料分析與挖掘:基於機器學習》《 TensorFlow 深度學習應用實踐》《 OpenCV+TensorFlow 深度學習與計算機視覺實戰》《 TensorFlow 知識圖譜實戰》《 TensorFlow 人臉識別實戰》《 TensorFlow 語音識別實戰》《 TensorFlow 2.0 卷積神經網路實戰》《 Keras 實戰:基於 TensorFlow2.2 的深度學習實踐》《 TensorFlow 深度學習從零開始學》《深度學習的數學原理與實現》。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18841117/viewspace-2877253/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 機器學習庫Spark MLlib簡介與教程機器學習Spark
- 【機器學習】機器學習簡介機器學習
- 《Python機器學習與視覺化分析實戰》簡介Python機器學習視覺化
- 資料分析與挖掘-挖掘建模
- 【機器學習基礎】半監督學習簡介機器學習
- 機器學習簡介機器學習
- 基於 Spark 的資料分析實踐Spark
- 《Hadoop+Spark大資料分析實戰》簡介HadoopSpark大資料
- Scikit-Learn 與 TensorFlow 機器學習實用指南學習筆記1 — 機器學習基礎知識簡介機器學習筆記
- 基於事件日誌的流程挖掘簡介 - Chaudhuri事件
- AutoTiKV:基於機器學習的資料庫調優機器學習資料庫
- 做資料分析需要學習機器學習嗎?機器學習
- Python資料分析 Pandas模組 基礎資料結構與簡介Python資料結構
- 機器學習基本概念簡介機器學習
- 《Python機器學習實踐》簡介Python機器學習
- 人工智慧-機器學習簡介人工智慧機器學習
- 【機器學習】李宏毅——機器學習基本概念簡介機器學習
- 大資料分析/機器學習基礎之matplotlib繪圖篇大資料機器學習繪圖
- Spark UI (基於Yarn) 分析與定製SparkUIYarn
- InterPSS :基於 TensorFlow 的電力系統分析機器學習機器學習
- InterPSS :基於TensorFlow的電力系統分析機器學習機器學習
- 機器學習基礎-資料降維機器學習
- Spark GraphX簡介與教程Spark
- Spring Boot中整合機器學習簡介Spring Boot機器學習
- 大資料分析與機器學習之間的區別與聯絡大資料機器學習
- 大資料基礎學習-9.Spark2.1.1大資料Spark
- 隨機學習簡介隨機
- Python資料分析與機器學習-使用者流失預警churmPython機器學習
- 大資料學習,大資料發展趨勢和Spark介紹大資料Spark
- (五)numpy知識學習2-python資料分析與機器學習實戰(學習筆記)Python機器學習筆記
- 《scikit-learn機器學習實戰》簡介機器學習
- 機器學習之神經網路簡介:剖析機器學習神經網路
- 機器學習實踐:如何將Spark與Python結合?機器學習SparkPython
- 基於python的大資料分析實戰學習筆記-pandas(資料分析包)Python大資料筆記
- [機器學習]協同過濾演算法的原理和基於Spark 例項機器學習演算法Spark
- (一) 機器學習和機器學習介紹機器學習
- Spark學習——資料傾斜Spark
- 【機器學習基礎】關於深度學習的Tips機器學習深度學習