书籍 Spark内核设计的艺术的封面

Spark内核设计的艺术

耿嘉安

出版时间

2017-12-31

ISBN

9787111584391

评分

★★★★★
书籍介绍

多位专家联袂推荐,360大数据专家撰写,基于Spark 2.1.0剖析架构与实现精髓。细化到方法级,提炼出多个流程图,立体呈现架构、环境、调度、存储、计算、部署、API七大核心设计。本书一共有10章内容,主要包括以下部分。

准备部分(第1~2章):简单介绍了Spark的环境搭建和基本原理。本部分通过详尽的描述,有效降低了读者进入Spark世界的门槛,同时能对Spark背景知识及整体设计有宏观的认识。

基础部分(第3~5章):介绍Spark的基础设施(包括配置、RPC、度量等)、SparkContext的初始化、Spark执行所需要的环境等内容。经过此部分的学习,将能够对RPC框架的设计、执行环境的功能有深入的理解,这也是对核心内容了解的前提。

核心部分(第6~9章):为Spark最核心的部分,包括存储体系、调度系统、计算引擎、部署模式等。通过本部分的学习,读者将充分了解Spark的数据处理体系细节,能够对Spark核心功能进行扩展、性能优化以及对线上问题进行精准排查。

API部分(第10章):这部分主要对Spark的新老API进行对比,对新API进行简单介绍。

目录
目录 Contents
本书赞誉
前言
第1章 环境准备 ········································1
1.1 运行环境准备 ···········································2

显示全部
用户评论
琐碎凌乱,全是代码片段。。。
内容还行,有一定深度,但是书的排版、编辑不太好,看起来就感觉像是在堆代码,可以精简一些
没看到什么艺术, 就在贴代码
很多内容都是对一段代码片段进行逐一的逻辑讲解。我觉得应该更多地增加些作者的思考。不然的话我觉得还不如直接阅读源码。
本书其实还好,大多数源码书都是这样,大部头辅助工具书 。要是嫌原理讲不清楚,说明你压根就没大好基础甚至没入门,这本书不适合你,请老老实实去看官方文档quick start或者spark权威指南。 乖,别那么浮躁,别想着一口气吃成胖子,整天想着“滥芋充数”装精通源码,这种投机心态做什么都是走不远的。
跟着书籍看源码,还是有帮助的。作者的技术功底还是可以的。适合想看源码的同学学习
我觉得读者更多是想看你对spark代码的理解,想看你把源码翻译成通俗易懂的东西,而不是纯粹在这粘代码然后翻译代码。每一个字段每个方法都一个落的罗列并解释下,毫无轻重主次之分,我又不是买本字典,十年经验的大牛不应该是这样子。