书籍 Hadoop技术内幕的封面

Hadoop技术内幕

董西成

出版时间

2013-11-30

ISBN

9787111445340

评分

★★★★★
书籍介绍

本书从应用角度系统讲解了YARN的基本库和组件用法、应用程序设计方法、YARN上流行的各种计算框架(MapReduce、Tez、Storm、Spark),以及多个类YARN的开源资源管理系统(Corona和Mesos);从源代码角度深入分析YARN的设计理念与基本架构、各个组件的实现原理,以及各种计算框架的实现细节。

全书共四部分13章:第一部分(第1~2章)主要介绍了如何获取、阅读和调试Hadoop的源代码,以及YARN的设计思想、基本架构和工作流程;第二部分(第3~7章)结合源代码详细剖析和讲解了YARN的第三方开源库、底层通信库、服务库、事件库的基本使用和实现细节,详细讲解了YARN的应用程序设计方法,深入讲解和分析了ResourceManager、资源调度器、NodeManager等组件的实现细节;第三篇(第8~10章)则对离线计算框架MapReduce、DAG计算框架Tez、实时计算框架Storm和内存计算框架Spark进行了详细的讲解;第四部分(第11~13章)首先对Facebook Corona和Apache Mesos进行了深入讲解,然后对YARN的发展趋势进行了展望。附录部分收录了YARN安装指南、YARN配置参数以及Hadoop Shell命令等非常有用的资料。

目录
前 言
第一部分 准备篇
第1章 环境准备 2
1.1 准备学习环境 2
1.1.1 基础软件下载 2

显示全部
用户评论
不错,简洁明了。
虽然灌水很严重,但是说Yarn的部分还比较详细,还提供了源码阅读的建议,总的来说对了解Yarn的整体架构还是挺有帮助的。
hadoop三部曲之一,系统学习一下。
对的时候是想了解yarn是怎样一个过程。可以一本参考书。
内容整体还是很不错的!大赞! 本书内容重点在Yarn上。 但作者没有单纯枯燥地讲解Yarn实现上各种逻辑。 更多地是带领读者学习yarn的设计思想,如事件驱动,状态机编程模型等。 还在一定程度带领读者领略了hadoop底层的的基础知识(如rpc,序列化,网络通信模型)等风采,完全可以带读者入门这些知识,方便后续深入地学习。 最后还结合各种计算框架(mr,storm)实战了下yarn。 整体来说阅读这本书收益还是蛮大的,由点到面,又有一定的深度,能触发读者思考!
感觉没mapreduce写得好,有点东拼西凑,代码贴了很多但是有些原理没讲透
难得讲了tez
对yarn的实现讲解的很清楚,有些内容有些冗余。
透明与封装是对初学者最大的仁慈。工作中用到,查查。工作流程,组件和协议。RPC远程框架
书里有很多错误