当先锋百科网

首页 1 2 3 4 5 6 7

#好书推荐##好书奇遇季#《Hadoop+Spark大数据分析实战》,京东当当天猫都有发售。定价69元,打折一下更便宜。配套源码、PPT课件,可以做大数据分析课程的教材。

本书是Hadoop + Spark大数据分析技术入门书,基于Hadoop和Spark两大框架体系的3.2版本,以通俗易懂的方式介绍Hadoop + Spark原生态组件的原理、集群搭建、实战操作,以及整个Hadoop生态系统主流的大数据分析技术,并提供影评分析、旅游酒店评价分析两个实战项目来贯穿大数据分析的完整流程。

本书内容

本书共分14章。第1章讲解Hadoop框架及新版本特性,并详细讲解大数据分析环境的搭建工作,包括Linux操作系统的安装、SSH工具使用和配置等;第2章讲解Hadoop伪分布式的安装和开发体验,使读者熟悉Hadoop大数据开发两大核心组件,即HDFS和MapReduce;第3~12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadoop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume,以及Spark框架数据处理、机器学习等实战技术,并通过实际案例加深对各个框架的理解与应用;第13~14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。

本书读者

本书可以作为大数据分析初学者的入门指导书,也可以作为大数据开发人员的参考手册,同时也适合作为高等院校大数据相关专业的教材或教学参考书。

本书作者

迟殿委,计算机软件与理论专业硕士,系统架构设计师。有多年企业软件研发经验和丰富的JavaEE培训经验,熟练掌握JavaEE全栈技术框架,对Java核心编程技术有深刻理解。主要擅长JavaEE系统架构设计、大数据分析与挖掘。著有图书《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》《Spring Boot+Spring Cloud微服务开发》《深入浅出Java编程》。

图书推荐

《分布式数据库HBase案例教程》《Hadoop 3大数据技术快速入门》《Kettle构建Hadoop ETL系统实践》《Cloudera Hadoop大数据平台实战指南》《Python数据分析与挖掘实战》《Flink入门与实战》《Python大数据处理库PySpark实战》《Python大数据分析算法与实例》《大数据技术入门(第2版)》《Spark 3.0大数据分析与挖掘:基于机器学习》