0
推荐
10172
阅读

ggplot2——annotate注释

之前有网友问我如何在ggplot2绘制的图片左上角添加文字,由于最近个人的一些事情比较忙,一直没能及时回复,所以今天通过这篇文章分享一个通过注释的方法来完成这个。这里以iris数据为例,library(ggplot2) head(iris) data("iris") p<-ggplot(iris,aes(x=Sepal.Length,y=Sepal.Width))+geom_point()+aes(colour=Spec...

发表了文章 • 2018-07-23 15:20 • 0 条评论

0
推荐
1828
阅读

这么炫的艺术照不只PS可以

等废话不说直接上图不知道大家感觉如何,是不是很有艺术气息。很多人认为这种图可以使用PS做出了,当然是对的,但是如果要做的比较精细,又有多少人会做?那种五毛钱的不用算了,算的话我五分钟就可以做出了。今天推荐一个R扩展包——threejs,是专门用于绘制交互式3D图形,可以绘制网络图,散点坐标图和球状图等。分别对...

发表了文章 • 2018-06-26 10:45 • 0 条评论

1
推荐
2119
阅读

基于Spark ALS算法的个性化推荐(仅需三行代码)

今天来使用spark中的ALS算法做一个小推荐。需要数据的话可以点击查看初识sparklyr—电影数据分析,在文末点击阅读原文即可获取。其实在R中还有一个包可以做推荐,那就是recommenderlab。如果数据量不大的时候可以使用recommenderlab包,之前也用该包做过电影评分预测模型(点击即可查看)。如果数据量较大还是推荐使用spa...

发表了文章 • 2018-05-23 13:49 • 0 条评论

1
推荐
1491
阅读

用 = 还是<-?傻傻分不清

R语言赋值可以用=或<-,一般都建议使用<-,那你知道这两个之间的区间吗?那你有没有见过‘<-’和‘=’这种赋值方法吗?今天就来和大家聊聊这基本的赋值符号都有哪些区别。首先我们来看看符号的优先级,和java,c这些编程语言的优先级类似。下面这些都取自R帮助文档,输入?Syntax即可查看,它是根据优先级从高到低排...

发表了文章 • 2018-05-17 10:49 • 0 条评论

0
推荐
1903
阅读

爬虫 | 正则表达式提取腾讯教育新闻链接及图片链接

前面的爬虫都是通过标签来爬取的,今天就分享一个小例子使用正则表达式来提取网页信息。如果你对正则表达式不熟悉,可以查看我之前写的R正则表达式这篇文章。它对R几个常用正则表达式进行了详尽的解释,包括参数说明,函数区别,正则表达式转义等都有介绍。今天通过爬取腾讯教育(http://edu.qq.com/)网页的所有关于教...

发表了文章 • 2018-05-17 10:06 • 0 条评论

2
推荐
1644
阅读

被自己吓到了,估计这样写爬虫的也就只有我一个人

提前声明,这不是一个好的例子,所以不要向我学习。让我先冷静一下!OK,开始,今天我们开始从下面链接爬虫。http://www.imdb.com/search/title?count=100&release_date=2016,2016&title_type=feature。打开页面如下:总共有100页,包含电影1万多部。我只爬取了2000个。(PS:等我截下面这张图时顺序已经和原来...

发表了文章 • 2018-03-22 17:29 • 0 条评论

3
推荐
1767
阅读

日期格式那么多,处理起来却贼简单

在处理一些数据中,我经常遇到一些日期数据,今天就来说说对于不同格式的日期数据该怎么处理。下面是一些常用来处理的函数。as.Date(x, ...)## S3 method for class 'character'as.Date(x, format, ...)## S3 method for class 'numeric'as.Date(x, origin, ...)## S3 method for class 'POSIXct'as.Date(x, tz = "UTC",...

发表了文章 • 2018-03-05 11:03 • 0 条评论

1
推荐
2014
阅读

聚类分析简单介绍(附R对应函数介绍)

聚类分析是一种机器学习领域最常用的分类方法,它在在客户分类,文本分类,基因识别,空间数据处理,卫星图片处理,医疗图像自动检测等领域有着广泛应用。聚类就是将相同,相似的对象划分到同一个组中,聚类分析事前不需要参考任何分类信息,可以通过判断数据表特征的相似性来完成对数据的归类。在聚类分析中,观测值的...

发表了文章 • 2018-02-26 10:50 • 0 条评论

2
推荐
2201
阅读

啤酒和尿布的故事是真的吗

关联分析概述啤酒和尿布的故事,我估计大家都听过,这是数据挖掘里面最经典的案例之一。它分析的方法就关联分析。关联分析,顾名思义,就是研究不同商品之前的关系。这里就发现了啤酒和尿布这两个看起来毫不相关的东西直接存在的微妙关系。最经典的关联分析算法之一就是Apriori算法,也是数据挖掘十大算法之一。在R中就...

发表了文章 • 2018-01-10 11:59 • 0 条评论

0
推荐
1649
阅读

R | 对亚马逊新总部可能位置进行可视化

听说上次分前不久,亚马逊宣布在寻找一个城市建立第二个总部。他们对这个城市的标准是超过100万人,同时这个城市也要大批高学历人才。在一个新闻网站上面发现,我发现了一些可能的城市名单,他们都有超过100万的人口,而且每个城市都是人才济济。https://www.cbsnews.com/news/amazon-hq2-cities-location-choices-new-s...

发表了文章 • 2017-12-06 14:58 • 0 条评论

0
推荐
2108
阅读

情感分析 | 一份就职宣誓也许就可以预测一个国家未来几年的政治形势

正想准备做一个情感分析,结果在网上搜了一些资料,然后发现了一个专门用来做英文情感分析的包,再说一遍是做英文情感分析的包——RSentiment。了解之后发现这个包比较简单,只有6个函数,每个函数的参数也都特别少,至少一个,最多才三个。这六个函数的作用都一样,只是返回值和参数略有不同罢了,先来说说每个函数的返回...

发表了文章 • 2017-11-03 16:33 • 0 条评论

0
推荐
1640
阅读

谁来帮我把这个128个音频下载一下

谁来帮我把这个128个音频下载一下,一下一下点,手都发麻了。链接在这http://download.dogwood.com.cn/online/gfxz2018/index.html。让舍友帮忙下载,结果给我说他打王者荣耀输了8场,今天必须要赢一次。然后我就一个人默默的想办法。后来我在网上搜到了一个函数——download.file(),它今天可算是救了我一条命。它的作用...

发表了文章 • 2017-09-06 10:37 • 0 条评论

1
推荐
1597
阅读

让你的脚本一键运行

你平时都是怎么运行你的R脚本的呢?是打开R还是打开Rstudio再运行你的R脚本的呢?你不觉得这样很麻烦吗?今天就给你教一招,简单方便,也不用修改环境变量,让你的脚本像启动程序一样,点一下就自动执行了。首先我们新建一个记事本,写入下面代码。写完之后保存,将记事本的后缀.txt改成.bat保存。一. 使用R.exe程序运行...

发表了文章 • 2017-08-03 16:04 • 0 条评论

0
推荐
1757
阅读

R常用包分类汇总 终极版

R常用包分类汇总 终极版出来了,在此我要深深地感谢之前参加活动的各位菜鸟粉们的积极补充。这篇文章与之前那篇文件相比,新增70余个包,我已经用不同颜色进行了标注,赶紧收藏吧!机器学习nnet,rpart,gbm, kernlab, mboost,  randomForest  ,tree,party,lars,boost,e1071,BayesTree,gafit...

发表了文章 • 2017-07-28 16:24 • 0 条评论

2
推荐
2308
阅读

rvest包,优雅的爬取猎聘网招聘信息

前不久,我用rvest包爬取了政府工作报告,通过jiebaR分词,并用wordcloud2进行了词云分析。《点击图片即可查看》今天,我们来用rvest包爬取猎聘网上的招聘信息。链接为 https://www.liepin.com/zhaopin/?init=1。打开的页面如上图,今天任务要爬取红色区域里面用绿色标记的那些信息,爬取完之后保存下来。在开始之...

发表了文章 • 2017-07-12 15:18 • 0 条评论