书籍 自然语言处理与计算语言学的封面

自然语言处理与计算语言学

[法] 巴格夫·斯里尼瓦萨-德西坎

出版时间

2020-07-01

ISBN

9787115540249

评分

★★★★★
书籍介绍
本书是一门融语言学、计算机科学、数学于一体的科学,研究人与计算机之间用自然语言进行有效通信的各种理论和方法。计算语言学是指通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,旨在以机器来模拟人的部分或全部语言能力的目的。《自然语言处理与计算语言学》作为一本借助于Python编程语言以及各种开源工具(如Gensim、spaCy等)来执行文本分析、自然语言处理和计算语言学算法的图书,从应用层面介绍了相关的理论知识和所涉及的技术。《自然语言处理与计算语言学》共分为15章,其内容涵盖了文本分析的定义、使用Python进行文本分析的技巧、spaCy语言模型、Gensim工具、词性标注及其应用、NER标注及其应用、依存分析、主题模型、高级主题建模、文本聚类和文本分类、查询词相似度计算和文本摘要、词嵌入、使用深度学习处理文本、使用Keras和spaCy进行深度学习、情感分析与聊天机器人的原理介绍等。 《自然语言处理与计算语言学》适合对自然语言处理的实现细节感兴趣的Python程序开发人员阅读。如果读者具备统计学的基本知识,对学习本书内容会大有裨益。 Bhargav Srinivasa-Desikan是就职于法国INRIA公司(位于里尔)的一名研究人员。作为MODAL(数据分析与机器建模)小组的一员,致力于度量学习、预测聚合和数据可视化等研究领域。同时,他也是Python开源社区的一名活跃贡献者,在2016年度Google的夏季编程赛上,他通过Gensim实现了动态主题模型。Bhargav是欧洲和亚洲PyCons和PyDatas的常客,并使用Python进行文本分析教学。他也是Python机器学习软件包pycobra的维护者,还在Machine Learning Research杂志上发表过相关文章。
目录
版权声明
内容提要
关于作者
关于审稿人
前   言

显示全部
用户评论
这部书讲的是 spaCy,而不是 NLTK。spaCy 确实比 NLTK 实用多了。不过除此之外毫无亮点了。。泛泛而谈
今天花了不到五个半小时,看完了《自然语言处理与计算语言学》,跟着前七章敲了部分代码,涉及自己训练模型的就没敲代码,后半本书涉及神经网络、深度学习之类比较麻烦的我只是看了一遍,没有实践,因为对我来说目前没有太大的用处。这本书蛮好的,但是适合有一些基础的人,比如我发现它里面有段代码有问题,我自己改了之后才跑起来。我感觉前半本书讲的是计算语言学,后半本讲的是NLP,后面确实太难了,不是我这一年的学习重点。尤其适合学法语的同学,因为作者是法国人,提到了一点点法语的例子,不过基本上全部都是英语的例子啦。