书籍 大数据架构商业之路的封面

大数据架构商业之路

黄申

出版时间

2016-04-30

ISBN

9787111535287

评分

★★★★★

标签

算法

书籍介绍

目前大数据技术已经日趋成熟,但是业界发现与大数据相关的产品设计和研发仍然非常困难,技术、产品和商业的结合度还远远不够。这主要是因为大数据涉及范围广、技术含量高、更新换代快,门槛也比其他大多数IT行业更高。人们要么使用昂贵的商业解决方案,要么花费巨大的精力摸索。本书通过一个虚拟的互联网O2O创业故事,来逐步展开介绍创业各个阶段可能遇到的大数据课题、业务需求,以及相对应的技术方案,甚至是实践解析;让读者身临其境,一起来探寻大数据的奥秘。书中会覆盖较广泛的技术点,并提供相应的背景知识介绍,对于想进一步深入研究细节的读者,也可轻松获得继续阅读的方向和指导性建议。

目录
推荐序一
推荐序二
前  言
第1章 抉择 1
第2章 数据收集 4

显示全部
用户评论
本书的第一大部分概述了大数据的主要技术,包括大数据的获取、存储、处理,还有架构设计的基本理念,以及常用的消息和缓存机制。这一部分你会发现关于Nutch、Flume、Hadoop、HBase、Redis、Hive、Kafka、Spark、Storm等的简介。对于数据处理的高级技术,本书着墨不少,但不乏对于信息检索和数据挖掘课题的探讨。例如站内搜索引擎、推荐系统、广告系统、聚类、分类和线性回归等。由于商业需求尤其看重实际产出,因此第一部分的最后还会分析常见的效果和性能评估。 第二大部分的每个章节都是从业务需求的描述入手,然后进行需求分析,根据需求的特点,对第一大部分所涉及的备选技术进行筛选,最后是技术方案和架构的确定。不同的商业需求可能会使用类似的技术点。
入门不错,让人对应用和技术的结合有了个基本概念
非常详实,有逻辑条理
看到分准备弃了,看到评价还不错准备看掉。 写得太浅了,弃掉。
太浅
本书有一个实际项目的技术方案的介绍和实现,关注的重点在于整体性技术方案介绍和思考。但是,最深感受:过去认为的性能优化,只是考虑了最不重要的编码和规范,其实性能提升最简单的是物理上加机器,更新软件,真正的性能优化,是改变技术方案和技术架构
2016年的书,书中介绍的技术栈在当今2021年仍是主流,京东,Ebay,Shopify等电商企业还在用。如果你是每星期产生数据量小于300TB的中小企业,那就不用凑热闹了,你还没达到大数据的数据量门槛,学习这玩意的主要意义在于你面试的时候可以吹水(或者像我一样来写书评装逼)。大数据这套技术起源于2004年Google的论文《在大规模集群上的啥啥啥》,大意是说全世界的网页数量太多了,Google要检索整个互联网上的信息,现有的机器和存储架构扛不住,然后提出来各种歪门邪道的优化思路。记住,这跟你没关系。对你来说,SQL的like关键字,比什么高大上的搜索技术都更加直接有效,易理解易维护。看书归看书,回去上班我还是继续写我的where 字段名 like '%关键词%'。
浅显易懂的对话,很不错
浅显易懂,适合非技术入门读