这是一本关于中文自然语言实战处理(简称NLP)的书,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLP是一门融语言学、计算机科学、数学于一体的科学。本书的选题偏重实战,不仅系统介绍了NLP所需要设计的知识点也同时教会读者如何实际应用与开发。围绕这个主题,本书从章节规划到具体的讲述方式,会具有以下二个特点:
第一个特点是本书的主要目标读者定位为在中国高校相关专业的大学生(统计学,计算机技术)、NLP爱好者、以及不具备专业数学知识的人群。NLP是一系列学科的集合体,其中包含了语言学,机器学习,统计学,大数据以及人工智能等方面,尤其依赖数学知识才能深入理解其原理。因此本书对专业知识的讲述过程必须绕过复杂的数学证明,从问题的前因后果,从创造者思考的过程,从概率或几何解释代替数学解释等一系列迂回的路径去深入模型的本源,这可能多少会牺牲一些严谨性,但是却能换来对大多数人更为友好的阅读体验。
第二个特点是本书是一本介绍中文自然语言处理的书,中文分词相对于英文分词来说更为复杂,读者将通过例子来学习,体会到能够通过实践验证自己想法的价值,我们提供了丰富的来自NLP领域的案例。在本书的内容编制上,追寻知识点背景介绍—原理剖析—实战案例,所有的代码会在书中详细列出或者上传Github方便读者下载与调试,帮助读者不仅快速掌握知识点,快速上手,并且可以应用到后续实际的开发项目中。在实际项目章节中,选取目前在NLP(自然语言处理)领域中比较热门的项目,将之前的知识点进行汇总,帮助读者巩固与提升。本书也不是高深的计算机科学书籍,书的内容比较适合对nlp的理解介于初级与中级水平之间的读者。
下面来介绍一下本次赠送活动的主角:
《Python自然语言处理实战》 京东购买地址:http://item.jd.com/12375644.html
作者:涂铭,刘树春,刘详
第一部分的内容包括1/2章和第11章,主要介绍了自然语言处理所需要了解的Python科学包、正则表达式以及Solr检索。
第二部分的内容包括5/6/7/8/9/10章的内容,主要是介绍NLP相关的各个知识点。分别介绍了:
第3/4/5章主要介绍了词法分析层面的一些技术,这一部分是NLP技术的基础,需要读者熟练掌握。
第6章介绍了句法分析技术,该部分目前理论研究较多,工程实践中使用门槛相对较高,且效果多是依赖结合业务知识进行规则扩展,因此本书未做深入探讨,读者了解即可。
本书第7章介绍了常用的向量化方法。这些方法常用于各种NLP任务的输入,读者需重点掌握。
第8章介绍了情感分析相关的概念、场景以及一般做情感分析的流程,情感分析在很多行业都有应用,所以需要读者熟练掌握。
第9章介绍了机器学习的一些基本概念,同时重点突出在NLP常用的分类算法、聚类算法,同时还介绍了几个案例,这章是NLP的基础内容,需要重点掌握。
第10章节介绍了NLP中常用的一些深度学习算法,这些方法比较复杂,但是非常实用,需要读者耐心学习。