《Hadoop+Spark大資料分析實戰》簡介

brucexia發表於2022-07-27

# 好書推薦 ## 好書奇遇季 # Hadoop+Spark 大資料分析實戰》,京東噹噹天貓都有發售。定價 69 元,打折一下更便宜。配套原始碼、 PPT 課件,可以做大資料分析課程的教材。

 

本書是 Hadoop + Spark 大資料分析技術入門書,基於 Hadoop Spark 兩大框架體系的 3.2 版本,以通俗易懂的方式介紹 Hadoop + Spark 原生態元件的原理、叢集搭建、實戰操作,以及整個 Hadoop 生態系統主流的大資料分析技術,並提供影評分析、旅遊酒店評價分析兩個實戰專案來貫穿大資料分析的完整流程。

 

本書內容

 

本書共分 14 章。第 1 章講解 Hadoop 框架及新版本特性,並詳細講解大資料分析環境的搭建工作,包括 Linux 作業系統的安裝、 SSH 工具使用和配置等;第 2 章講解 Hadoop 偽分散式的安裝和開發體驗,使讀者熟悉 Hadoop 大資料開發兩大核心元件,即 HDFS MapReduce ;第 3~12 章講解 Hadoop 生態系統各框架 HDFS MapReduce 、輸入輸出、 Hadoop 叢集配置、高可用叢集、 HBase Hive 、資料實時處理系統 Flume ,以及 Spark 框架資料處理、機器學習等實戰技術,並透過實際案例加深對各個框架的理解與應用;第 13~14 章分別透過影評分析、旅遊酒店評價分析實戰專案來貫穿大資料分析的完整流程。

 

本書讀者

 

本書可以作為大資料分析初學者的入門指導書,也可以作為大資料開發人員的參考手冊,同時也適合作為高等院校大資料相關專業的教材或教學參考書。

 

本書作者

 

遲殿委,計算機軟體與理論專業碩士,系統架構設計師。有多年企業軟體研發經驗和豐富的 JavaEE 培訓經驗,熟練掌握 JavaEE 全棧技術框架,對 Java 核心程式設計技術有深刻理解。主要擅長 JavaEE 系統架構設計、大資料分析與挖掘。著有圖書《 Hadoop+Spark 大資料分析實戰》《 Spring Boot 企業級開發實戰(影片教學版)》《 Spring Boot+Spring Cloud 微服務開發》《深入淺出 Java 程式設計》。

 

圖書推薦

 

《分散式資料庫 HBase 案例教程》《 Hadoop 3 大資料技術快速入門》《 Kettle 構建 Hadoop ETL 系統實踐》《 Cloudera Hadoop 大資料平臺實戰指南》 Python 資料分析與挖掘實戰》《 Flink 入門與實戰》《 Python 大資料處理庫 PySpark 實戰》《 Python 大資料分析演算法與例項》《大資料技術入門(第 2 版)》《 Spark 3.0 大資料分析與挖掘:基於機器學習》


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/18841117/viewspace-2907763/,如需轉載,請註明出處,否則將追究法律責任。

相關文章