书籍介绍
在当今数据爆炸的时代,如何从海量数据中提取有价值的信息,成为了企业和个人共同面临的挑战。而《Spark高级数据分析(第2版)》正是为了帮助读者应对这一挑战而诞生的。它通过深入浅出的方式,将复杂的Spark技术讲解得通俗易懂,让读者能够轻松掌握大数据分析的核心技能。
作者简介
桑迪·里扎, Spark项目的关键开发者, Hadoop项目管理委员会的成员, Time Series for Spark项目的创始人. 他目前在Remix公司担任工作,研究公共交通算法. 他之前是Cloudera公司的高级数据科学家。
推荐理由
《Spark高级数据分析(第2版)》通过详细阐述Spark框架及其在数据分析中的应用,为读者提供了一个深入理解和掌握大数据分析工具的途径。书中不仅介绍了Spark的核心API和编程模型,还通过丰富的案例和实例,展示了Spark在数据清洗、模型构建、推荐系统、决策树、聚类、文本分析、网络分析、地理空间数据分析和基因数据分析等方面的应用。这本书不仅是一本实用的Spark学习指南,也是大数据分析领域不可或缺的参考资料。
适合哪些人读
1. 对大数据分析、数据科学和机器学习感兴趣的读者
2. 希望提高数据分析技能,将Spark应用于实际项目的数据分析师和工程师
3. 在高校或研究机构从事数据分析研究的研究生和研究人员
4. 企业中负责数据管理、数据分析和数据挖掘的相关人员。
目录
推荐序 ix
译者序 xi
序 xiii
前言 xv
第1章 大数据分析 1
显示全部