《Spark 3.0大資料分析與挖掘:基於機器學習》簡介

brucexia發表於2022-03-20

# 好書推薦 ## 好書奇遇季 # Spark 3.0 大資料分析與挖掘:基於機器學習》,京東噹噹天貓都有發售。 Spark 作為新興的、應用範圍廣泛的大資料處理開源框架,吸引了大量的大資料分析與挖掘從業人員進行相關內容的學習與開發,其中 ML Spark 3.0 機器學習框架使用的核心。本書用於 Spark 3.0 ML 大資料分析與挖掘入門,本書配套示例原始碼、 PPT 課件、資料集與答疑服務。

 

本書內容

 

本書共分 13 章,從 Spark 3.0 大資料分析概述、基礎安裝和配置開始,依次介紹 ML DataFrame ML 的基本概念,以及協同過濾、線性迴歸、分類、決策樹與隨機森林、聚類、關聯規則、資料降維、特徵提取和轉換等資料處理方法;最後透過經典的鳶尾花分析例項,回顧前面的學習內容,實現了一個完整的資料分析與挖掘過程。

 

本書特點

 

1 )本書儘量避免純粹的理論知識介紹和高深技術研討,完全從應用實踐出發,用最簡單、典型的示例引申出核心知識,最後指出通往 高精尖 進一步深入學習的道路。

2 )本書全面介紹 ML 涉及的資料探勘的基本結構和上層程式設計,藉此能夠系統地看到 ML 的全貌,使讀者在學習過程中不至於迷失方向。

3 )本書在寫作上淺顯易懂,沒有深奧的數學知識,採用較為簡潔的形式描述應用的理論知識,讓讀者輕鬆愉悅地掌握相關內容。

4 )本書旨在引導讀者進行更多技術上的創新,每章都會用示例描述的形式幫助讀者更好地學習內容。

5 )本書程式碼遵循重構原理,避免程式碼汙染,引導讀者寫出優秀、簡潔、可維護的程式碼。

6 )本書所有資料格式均為 DataFrame 型別,並且使用管道技術執行機器學習演算法。

 

本書讀者

 

本書適合 Spark 3.0 機器學習初學者、大資料分析和挖掘人員,也適合高等院校和培訓機構人工智慧與大資料相關專業的師生教學參考。

 

本書作者

 

王曉華,計算機專業講師,研究方向為雲端計算、大資料與人工智慧。著有圖書《 Spark 3.0 大資料分析與挖掘:基於機器學習》《 TensorFlow 深度學習應用實踐》《 OpenCV+TensorFlow 深度學習與計算機視覺實戰》《 TensorFlow 知識圖譜實戰》《 TensorFlow 人臉識別實戰》《 TensorFlow 語音識別實戰》《 TensorFlow 2.0 卷積神經網路實戰》《 Keras 實戰:基於 TensorFlow2.2 的深度學習實踐》《 TensorFlow 深度學習從零開始學》《深度學習的數學原理與實現》。

 

 

 

 

 


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18841117/viewspace-2877253/,如需轉載,請註明出處,否則將追究法律責任。

相關文章