书籍 Python数据科学手册的封面

Python数据科学手册

[美] Jake VanderPlas

出版时间

2018-01-19

ISBN

9787115475893

评分

★★★★★

标签

编程

书籍介绍

本书是对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。本书共五章,每章介绍一到两个Python数据科学中的重点工具包。首先从IPython和Jupyter开始,它们提供了数据科学家需要的计算环境;第2章讲解能提供ndarray对象的NumPy,它可以用Python高效地存储和操作大型数组;第3章主要涉及提供DataFrame对象的Pandas,它可以用Python高效地存储和操作带标签的/列式数据;第4章的主角是Matplotlib,它为Python提供了许多数据可视化功能;第5章以Scikit-Learn为主,这个程序库为最重要的机器学习算法提供了高效整洁的Python版实现。

本书适合有编程背景,并打算将开源Python工具用作分析、操作、可视化以及学习数据的数据科学研究人员。

目录
译者序 xiii
前言 xv
第1 章 IPython:超越Python 1
1.1 shell还是Notebook 1
1.1.1 启动IPython shell 2

显示全部
用户评论
Well-organized 凡是碰到的概念都提前声明了
很好 notebook在github上开源可执行。竟然还包括如何实现书中所有图的代码。
除了版本低了,还是看2版吧。
这本书涉及到了数据分析常用的东西,跟实际操作接轨了。可以用做平时工作时的一个辅助,查询忘记了的东西。
实话告诉我,pandas那张是不是删了点什么....merge函数开始,on参数那里上来就说最好的办法是...前面问题你好歹告诉我啊!后面的例子举的真的很莫名其妙啊。不过是很好的工具书了,祝我渡劫python课。
这本书的厚度很适合作为数据工程的指标,1/2的pd+plt,1/3的mL,相比李庆辉(2021)这本书的策略更直白,能上eval和query的全上。其他部分写的中等偏上,PLT没有写成图层语法是一个缺憾,机器学习作为方法罗列疏密得当,差评在于没写成FP的形式。数据科学真的更适合FP,因为大部分的操作都是【纯】的。
比那本鼹鼠(?)书更详细 机器学习的篇幅很多 可视化也有一整章介绍,不过我选择R(?)
说实话,我感觉和看官方文档差异不大...可能就一些实操案例比较好吧,但是这种资源现在网上太多了
一刷完,属于Python进阶,决定先看Python crash course,再刷numpy、pandas,特别是pandas。
翻看除了机器学习的前四章,举的例子总体不错,作为手册突出查阅的共时性而非学习的历时性还是合适的。然而手册只是说明书,只能留下工具可以做什么的大概印象,因此看的时候主要也是看了结果而非实现方式。具体该做什么或者该怎么做,还是得等到在实践中结合目的因,才能慢慢体会。