5
推荐
2579
阅读
基于R语言构建的电影评分预测模型
评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。一,前提准备1.R语言包:ggplot2包(绘图), recommenderlab包, reshape包(数据处理)2.获取数据:大家可以在明尼苏达州大学的社会化计算研究中心官网上面下载这些免费数据集,网站链接为http://grouplens.org/datasets/mov...
0
推荐
2332
阅读
我把我用R写的第一个爬虫就献给了国家
作为我国社会主义事业的建设者和接班人,不仅要继承前辈开创的伟大事业,更要推进中国特色社会主义的航船继续破浪前进。这不,为了响应习大大开展的“两学一做”学习教育,我不仅认真学习共产党党章党规,学习贯彻习近平总书记系列重要讲话精神,争做一名合格党员。今天我就要用自己的技术来学习今年的《政府工作报告》。...
0
推荐
2122
阅读
jiebaR,从入门到喜欢
之前,我写过一篇关于Rwordseg包的分词,今天,我主要想谈谈jiebaR这个包。现在我也比较推荐使用jiebaR这个包,原因也大概总结了一下几点。什么事情的,怎么干。函数原型如下:worker(type = "mix", dict = DICTPATH, hmm = HMMPATH, user = USERPATH, idf = IDFPATH, stop_word = STOPPATH, write = T, qmax = 20, top...
0
推荐
2875
阅读
今天咱们来绘制一个知识图谱怎么样?
知识图谱,也称为科学知识图谱,它通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。今天我们借助netwo...
7
推荐
1798
阅读
仅用四行代码就可以挖掘你的QQ聊天记录
QQmining,这是我第一次尝试写的R包,由于还存在着一些警告问题,所以还无法从github上面进行安装,但是可以本地进行安装。如果要访问我的github,请点击阅读原文。如果你需要这个包的话就在后台回复QQmining 即可获取百度网盘分享链接。不过这个包是我在R 3.3.2版本开发的,尽量在3.3.2版本或更新的版本上面使用。...
2
推荐
1233
阅读
1
推荐
1318
阅读
R语言怎么给中文分词?
1.准备包 ①rJava包 ② Rwordseg包 ③java环境 ④搜狗词库(此为扩展词库) Rwordseg包依赖于rJava包。由于Rwordseg包并没有托管在CRAN上面,而是在R-Forge上面,因此在在R软件上面直接输入install.packages("Rwordseg")会提示错误。因此,我们需要在软件...
0
推荐
1108
阅读
使用R实现一个简单的连续系统模拟
连续系统就是指状态随着时间连续变化的系统。我们通过计算机模拟对连续系统得到的结果只是近似的,但如果只要这种近似达到了一定的精度,也就可以满足要求。连续系统模拟的一般方法就是首先建立系统的连续模型,然后转换为一个离散模型,并对该模型进行模拟。下面是一个追逐问题。 &n...
1
推荐
2210
阅读
简单的文本可视化—词云
“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于提出,词云是一种可视化描绘单词或词语出现在文本数据中频率的方式,它主要是由随机分布在词云图的单词或词语构成,出现频率较高的单词或词语则会以较大的形式呈现出来,而频率越低的单词或词语则会以较小的形式呈现。词云主...
1
推荐
1435
阅读
R语言如何导入数据
1.使用键盘输入数据 在导入数据比较少的时候,我们使用这种方法。R中的函数 edit() 会自动调用一个允许手动输入数据的文本编辑器。具体步骤如下:(1) 创建一个空数据框(或矩阵) ,其中变量名和变量的模式需与理想中的最终数据集一致;(2) 针对这个数据对象调用文本编辑器,输入你的数据,并将结果...
1
推荐
1290
阅读
浅谈R语言
大数据时代下,随之引起了数据挖掘,数据分析,机器学习等的迅速发展。于此同时,也让人们越来越注意到R语言功能的强大。在此之前,R语言几乎只是一些统计学家们再用。R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来...
1
推荐
2047
阅读
今天来挖挖你的QQ聊天记录
今天我们用R语言来处理一下。首先来说一下我们会用到的知识:(1)正则表达式(2)中文分词(3)词频统计(4)文本可视化(5)ggplot2绘图如果你对这几地方有不懂得地方可以在文末根据 推荐阅读 点击查看相关文章。一.数据处理首先我们要讲QQ聊天记录导出成txt文件,至于怎么导,我相信大家都会,不会自行百度...
1
推荐
1398
阅读
今天再来谈谈REmap包
之前我写过一篇关于REmap的文章,但有许多网友都存在不同的问题,在微信公众号后台或博客留言,向我请教一些问题。于是我就觉得很有必要再写一篇文章,好好的把REmap这个包好好的给大家介绍一下。我们都应该知道这个包的主要目的可交互的地图数据可视化的工具,托管在github,现在. 这个包是基于Echarts开发的一个...
0
推荐
1508
阅读
R语言常用函数汇总
今天把R常用函数大体汇总了一下,其中包括一般数学函数,统计函数,概率函数,字符处理函数,以及一些其他函数;1. 数学函数2. 统计函数3. 概率函数在R中,函数函数行如:[x][function]。其中x表示指分布的某一方面,function表示分布名称的缩写。d->密度函数(density)p->分布函数(distributi...
2
推荐
1505
阅读
Catterplots包,让你绘制不一样的图
就在最近我发现了一个比较有趣的包那就 CatterPlots包。至于怎么有趣那就接着看。首先我们来安装这个包:library(devtools)
install_github("Gibbsdavidl/CatterPlots")这个包目前在github,需要这样安装。首先我们来画一个圆形看看效果。radius <- 1
theta <- seq(0, 2 * pi, length = 30)
multicat(xs=radi...