NLP

0
推荐
3193
阅读

Python自然语言处理实战:计算两篇文章的相似度

本文来自《Python自然语言处理实战》章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!本节将利用训练好的词向量和段落向量对两篇关于天津全运会的新闻进行向量化,并计算两篇新闻的相似度。如下是两篇新闻:新闻1:6日,第十三届全运会女子篮球成年组决赛在天津财经大学体育馆打响,中国篮协主席姚明到场观...

发表了文章 • 2018-06-25 21:51 • 0 条评论

1
推荐
5991
阅读

Python自然语言处理实战:日期实体提取

本文来自《Python自然语言处理实战》章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!今天我要介绍的案例是自然语言处理中最为常见的:关键实体识别- 日期识别!在工程项目中,我们会经常面临日期识别的任务。当针对结构化数据时,日期设置一般有良好的规范,在数据入库时予以类型约束,在需要时能够通过解...

发表了文章 • 2018-06-25 21:12 • 0 条评论

0
推荐
2254
阅读

新书推荐—自然语言处理实战(内含赠书福利)

这是一本关于中文自然语言实战处理(简称NLP)的书,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLP是一门融语言学、计算机科学、数学于一体的科学。本书的选题偏重实战,不仅系统介绍了NLP所需要设计的知识点也同时教会读者如何...

发表了文章 • 2018-06-24 10:02 • 0 条评论

2
推荐
1859
阅读

挑战年薪百万-自然语言处理入门二

简单统计if __name__ == '__main__':     saying = ['After', 'all', 'is', 'said', 'and', 'done',               'more', 'is', 'said', 'than', 'done']     tokens = set(saying)     tokens = sor...

发表了文章 • 2017-05-26 10:36 • 0 条评论

7
推荐
2698
阅读

挑战年薪百万-自然语言处理入门一

所谓“自然语言”,是指人们日常交流使用的语言,如英语、印地语随着不断演化,很难用明确的规则来刻画。从广义上,“自然语言处理”(Natural Language Processing简称NLP)包含所有计算机对自然语言进行的操作,从最简单的通过计数词出现的频率来比较不同的写作风格到最复杂的完全“理解”人所说的话。基于NLP的技术应用日益...

发表了文章 • 2017-05-26 10:15 • 0 条评论

2
推荐
3368
阅读

潜在语义索引(LSI)文本相似度计算

1、潜在语义索引算法介绍潜在语义索引(LSI)是一种非监督的学习算法,它的原理是先把句子分词,用BOW方法对句子进行特征提取,组成句子的特征矩阵。把矩阵通过奇异值分解(SVD)的降维方法一个降维去燥后的新矩阵,来表示原来的矩阵。由特征组成的矩阵降维后,可以理解为把原来特征映射到其他低维空间。通过把词语映射到...

发表了文章 • 2017-05-24 23:10 • 0 条评论