文本挖掘

文本挖掘

1
推荐
545
浏览

【数据挖掘实操】用文本挖掘剖析近5万首《全唐诗》

作者:苏格兰折耳喵个人公众号: 运营喵是怎样炼成的温馨提示:图片显示毛糙和不清楚,是分辨率过高的缘故,点击图片,即可看到高清大图楔子近些年来,弘扬中华传统文化的现象级综艺节目不断涌现,如《中国...

Python爱好者社区 发表了文章 • 2018-11-13 17:56

0
投票
1
回答
608
浏览
1
推荐
463
浏览

文本数据的分分合合

对于数据分析工作来说,可能最希望的是面对规整、一致的数据,例如定义清晰明确的关系数据库,或者可以自由钻取、切片的OLAP 数据仓库。但不幸的是,很多时候,我们不得不面对来自方方面面的零散数据,亲自操刀煎...

润乾软件 发表了文章 • 2018-04-23 13:09

0
推荐
1225
浏览

基于jiebaR包的周杰伦歌词文本挖掘分析

  虽然现在NLP(自然语言处理)技术那么发达,但作为一个有志于在数据科学领域内搞出点动静的年轻人来说,用R来做一点文本挖掘还各种出错,各种困难不断,确实是有点说不过去。前两天看到R语言中文社区分享...

鲁伟 发表了文章 • 2017-06-16 13:40

0
推荐
1759
浏览

Python做文本挖掘的情感极性分析(基于情感词典的方法)

「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者...

郭昱良 发表了文章 • 2017-05-11 15:15

0
推荐
738
浏览

文本挖掘理论学习笔记(一)

一,什么是自然语言以语言,记号(文字)为载体的信息记录形式,用于个体或集体交流,知识传承。参考书:《统计自然语言处理》《统计自然语言处理基础》自然语言处理(NLP=Natural Language Processing):利用计算...

shannon1996 发表了文章 • 2017-04-27 16:24

0
推荐
1579
浏览

R文本挖掘之tm包

认识tm包tm包是R文本挖掘方面不可不知也不可不用的一个package。它提供了文本挖掘中的综合处理功能。如:数据载入,语料库处理,数据预处理,元数据管理以及建立“文档-词条”矩阵。下面,即从tm包提供的各项功能函...

黄耀鹏 发表了文章 • 2017-04-19 10:47

0
推荐
1148
浏览

R文本分类之RTextTools

RTextTools简介古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。它集成了(或者说支持)如下算法相关的包:支持向量机(Support Vector Machine from e...

黄耀鹏 发表了文章 • 2017-04-19 10:33

4
推荐
1107
浏览

使用文本挖掘实现站点个性化推荐

作者:韦玮,重庆韬翔网络科技有限公司(上海)董事长兼总经理,IT作家,CSDN社区专家。 技术背景一条信息是否能够让用户感兴趣,主要取决于这条信息的内容是否是用户关注的内容。而将用户感兴趣的信息推送...

韦玮 发表了文章 • 2017-04-18 15:26

0
投票
0
回答
473
浏览
7
推荐
844
浏览

原创 | 一点资讯分类新闻爬虫及其文本挖掘

【通往数据自由之路导读】好久不见,手提代码来见,这篇文章分享的是一点资讯新闻网站的抓取和数据分析,机器学习。直接放代码!流程思路:一点资讯是一个类似今日头条的新闻资讯类网站,我们通过抓取一点资讯上...

何红亮 发表了文章 • 2017-04-11 11:43

0
投票
1
已解决
514
浏览
2
推荐
781
浏览

R语言之中文分词:实例

一、说明      网上提供的一个例子,做了修改与订正。二、程序 #调入分词的库library("rJava") library("Rwordseg") #调入绘制词云的库library("RColorBrewer") li...

张子良 发表了文章 • 2017-03-07 09:37

4
推荐
1949
浏览

使用Python实现豆瓣阅读书籍信息的获取

最近一直在看Python方面的知识,包括数据分析中常用的numpy、pandas、scipy等模块;数据库API接口,如常见的pymysql、pymssql等模块;爬虫方面所需要的urllib、bs4等模块;还有正则表达式re模块。在之前的几期中...

每天进步一点点2015 发表了文章 • 2017-02-04 18:17

条新动态, 点击查看
朴素贝叶斯(Naive Bayes, NB)、Logistic回归(Logistic Regression, LR)等可以试试
朴素贝叶斯(Naive Bayes, NB)、Logistic回归(Logistic Regression, LR)等可以试试
例举一些Python处理库:
NLTK:Python的自然语言处理库;
NetworkX:Python的复杂网络分析库(e.g. 社交网络);
sklearn:Python的机器学习库;
Numpy:Python科学计算的底层库,主要支持数组和矩阵计算等;
P... 显示全部 »
例举一些Python处理库:
NLTK:Python的自然语言处理库;
NetworkX:Python的复杂网络分析库(e.g. 社交网络);
sklearn:Python的机器学习库;
Numpy:Python科学计算的底层库,主要支持数组和矩阵计算等;
Pandas:Python的数据分析库;
SciPy:Python的高级科学计算库,包括概率统计等;
statsmodels:Python的统计分析库;
SymPy:Python的符号计算库;
snownlp:情感分析;
textblob.
做短文本用线性svm,效果有目共睹,分词用jieba,词语向量化用Word2vec
1
推荐
545
浏览

【数据挖掘实操】用文本挖掘剖析近5万首《全唐诗》

作者:苏格兰折耳喵个人公众号: 运营喵是怎样炼成的温馨提示:图片显示毛糙和不清楚,是分辨率过高的缘故,点击图片,即可看到高清大图楔子近些年来,弘扬中华传统文化的现象级综艺节目不断涌现,如《中国...

Python爱好者社区 发表了文章 • 2018-11-13 17:56

1
推荐
463
浏览

文本数据的分分合合

对于数据分析工作来说,可能最希望的是面对规整、一致的数据,例如定义清晰明确的关系数据库,或者可以自由钻取、切片的OLAP 数据仓库。但不幸的是,很多时候,我们不得不面对来自方方面面的零散数据,亲自操刀煎...

润乾软件 发表了文章 • 2018-04-23 13:09

0
推荐
1225
浏览

基于jiebaR包的周杰伦歌词文本挖掘分析

  虽然现在NLP(自然语言处理)技术那么发达,但作为一个有志于在数据科学领域内搞出点动静的年轻人来说,用R来做一点文本挖掘还各种出错,各种困难不断,确实是有点说不过去。前两天看到R语言中文社区分享...

鲁伟 发表了文章 • 2017-06-16 13:40

0
推荐
1759
浏览

Python做文本挖掘的情感极性分析(基于情感词典的方法)

「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者...

郭昱良 发表了文章 • 2017-05-11 15:15

0
推荐
738
浏览

文本挖掘理论学习笔记(一)

一,什么是自然语言以语言,记号(文字)为载体的信息记录形式,用于个体或集体交流,知识传承。参考书:《统计自然语言处理》《统计自然语言处理基础》自然语言处理(NLP=Natural Language Processing):利用计算...

shannon1996 发表了文章 • 2017-04-27 16:24

0
推荐
1579
浏览

R文本挖掘之tm包

认识tm包tm包是R文本挖掘方面不可不知也不可不用的一个package。它提供了文本挖掘中的综合处理功能。如:数据载入,语料库处理,数据预处理,元数据管理以及建立“文档-词条”矩阵。下面,即从tm包提供的各项功能函...

黄耀鹏 发表了文章 • 2017-04-19 10:47

0
推荐
1148
浏览

R文本分类之RTextTools

RTextTools简介古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本分类开发包。它集成了(或者说支持)如下算法相关的包:支持向量机(Support Vector Machine from e...

黄耀鹏 发表了文章 • 2017-04-19 10:33

4
推荐
1107
浏览

使用文本挖掘实现站点个性化推荐

作者:韦玮,重庆韬翔网络科技有限公司(上海)董事长兼总经理,IT作家,CSDN社区专家。 技术背景一条信息是否能够让用户感兴趣,主要取决于这条信息的内容是否是用户关注的内容。而将用户感兴趣的信息推送...

韦玮 发表了文章 • 2017-04-18 15:26

7
推荐
844
浏览

原创 | 一点资讯分类新闻爬虫及其文本挖掘

【通往数据自由之路导读】好久不见,手提代码来见,这篇文章分享的是一点资讯新闻网站的抓取和数据分析,机器学习。直接放代码!流程思路:一点资讯是一个类似今日头条的新闻资讯类网站,我们通过抓取一点资讯上...

何红亮 发表了文章 • 2017-04-11 11:43

2
推荐
781
浏览

R语言之中文分词:实例

一、说明      网上提供的一个例子,做了修改与订正。二、程序 #调入分词的库library("rJava") library("Rwordseg") #调入绘制词云的库library("RColorBrewer") li...

张子良 发表了文章 • 2017-03-07 09:37

4
推荐
1949
浏览

使用Python实现豆瓣阅读书籍信息的获取

最近一直在看Python方面的知识,包括数据分析中常用的numpy、pandas、scipy等模块;数据库API接口,如常见的pymysql、pymssql等模块;爬虫方面所需要的urllib、bs4等模块;还有正则表达式re模块。在之前的几期中...

每天进步一点点2015 发表了文章 • 2017-02-04 18:17

2
推荐
1446
浏览

文本挖掘:手把手教你分析携程网评论数据

文本分析的应用越来越广泛,这不,我的工作也开始涉及了文本分析,今天就讲讲关于评论数据的那点事。首先评论数据如何获取?一般通过网络爬虫的方式抓取各大网站的评论数据,本次分析数据就来源于携程网某酒店的...

每天进步一点点2015 发表了文章 • 2017-02-04 17:38

3
推荐
1322
浏览

手把手教你做文本挖掘

一、文本挖掘定义文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。二、...

每天进步一点点2015 发表了文章 • 2017-02-04 17:30

1
推荐
1250
浏览

数据科学家成长指南(中)

在《 数据科学家成长指南(上) 》中已经介绍了基础原理、统计学、编程能力和机器学习的要点大纲,今天更新后续的第五、六、七条线路:自然语言处理、数据可视化、大数据。准备好在新的一年,学习成为未来五年最性...

秦路 发表了文章 • 2017-02-04 16:36

3
推荐
4261
浏览

深度学习Meetup速记(一)——基于深度学习的文本语义分析

基于深度学习的文本语义分析作者:邱锡鹏          编者按8月26日,星环科技与深度学习国际交流群举行首次深度学习Meetup,共有四位嘉宾进行了精彩的分享,本文系复旦大学计算机学院邱...

星环科技 发表了文章 • 2016-09-01 17:58