书籍介绍
在信息爆炸的时代,我们生活在一个被数据包围的世界。大数据不再仅仅是一个概念,而是推动商业决策、优化业务流程的关键力量。《Spark大数据商业实战三部曲》就是这样一本指南,它引领你探索如何利用Apache Spark这一强大的工具来挖掘数据的潜在价值,为你的组织创造竞争优势。从电影点评系统到电商广告分析,再到通信运营商的实时流处理,本书通过一系列生动的案例,让你亲身体验Spark在大数据世界中的威力。
作者简介
王家林,中国Spark技术的布道者和研究者,对Spark源码有深入的理解,尤其擅长Spark性能优化和问题解决。他是DT大数据梦工厂的创始人和首席专家,致力于开发适合中国的Spark版本。段智华,中国电信的系统架构师,CSDN博客专家,专注于Spark大数据和机器学习技术的研究与应用,对Spark源码有深入研究,特别是Spark的版本优化。
推荐理由
《Spark大数据商业实战三部曲》一书深入浅出地讲解了Apache Spark在实际商业环境中的应用,从基础概念到高级实践,再到性能调优,全面覆盖了大数据处理的关键领域。无论你是希望入门Spark的大数据新手,还是寻求提升技能的资深开发者,都能从中受益。本书不仅提供了丰富的实战案例和源码解析,还强调了理论与实践相结合的重要性,帮助读者在实际工作中解决复杂问题。
适合哪些人读
对大数据处理和Spark技术感兴趣的开发者
希望提升大数据分析能力的数据工程师和科学家
正在使用或计划采用Spark进行数据处理的企业决策者和技术团队负责人
对分布式计算、机器学习和实时流处理有研究兴趣的研究人员。
目录
作者简介
内容简介
前言
上篇 内核解密
第1章 电光石火间体验Spark 2.2开发实战
显示全部