0
推荐
2094
阅读

R导出可编辑图到ppt:结合使用ggplot2以及officer

作者:Bruno Rodrigues原文链接:https://www.brodrigues.co/blog/2018-10-05-ggplot2_purrr_officer/来源:R语言最近我面临以下的问题:创建数以百计的图片以便我们的客户仍旧可以编辑。这意味着我需要把图表导出到Excel、PPT或者其它客户熟悉的工具,而不是像往常那样把图片直接以pdf或者png形式导出。尽管我还是希望...

发表了文章 • 2019-03-18 09:35 • 0 条评论

0
推荐
2915
阅读

R语言自然语言处理:关键词提取(TF-IDF)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com本文希望诠释如何利用TF-IDF方法对文本中的关键词进行提取。关键词提取的输入是一大段文本材料,输出是少数的关键词。比如我们日常看的论文,会有...

发表了文章 • 2019-03-15 10:47 • 0 条评论

0
推荐
2607
阅读

shinydashboard与shiny_史上最全(一)

作者:李誉辉  四川大学在读研究生前言从本文开始连载shinydashboard与shiny_史上最全系列文章,本文章将分三部分连载:第一部分:1 简介2 shiny文件的创建和运行3 shinydashboard         3.1 标题栏(Header)       第二部分:       ...

发表了文章 • 2019-03-14 10:48 • 0 条评论

0
推荐
1374
阅读

【R包】2018年数据科学前20名R包

R在数据科学领域是一个众所周知且日益流行的工具。 它是一种主要为统计计算设计的编程语言和软件环境,因此其界面和结构非常适合科学任务。 此外,R还拥有最先进的包系统之一,有数千个软件包以解决各种各样的问题。虽然有很多通用的软件包,但我们希望将重点放在那些能够提供足够数据操作,可视化,竞争性研究和机...

发表了文章 • 2019-03-12 10:30 • 0 条评论

0
推荐
3553
阅读

R_leaflet包_最易上手地图教程(二)

作者:李誉辉  四川大学在读研究生这次,我们接着上一篇讲7.Colours着色将变量映射到颜色是地理信息可视化的一个重要组成部分。为了实现数值映射到颜色色值,leaflet中内置了一些color*开头的函数,非常方便将数值变量与颜色进行匹配,然后产生一个palette函数。这些palette函数, 能够根据输入数字向量返回一个...

发表了文章 • 2019-03-11 10:09 • 0 条评论

0
推荐
1807
阅读

R语言ETL系列:创建字段(mutate)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com有没有一些时候你想要给表格加一个新的列?本章将会介绍如何在表格中创建新的字段。但是首先我们要知道为什么要什么做,下面是可能的一些情况:有...

发表了文章 • 2019-03-11 10:09 • 0 条评论

0
推荐
2140
阅读

R爬虫小白入门:Rvest爬链家网+分析(三)

作者:汪喵行  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/yhannahwang前言上两节我们已经成功爬取了链家网的3w条数据,并且做了一些浅显的分析,那么这一节我们就利用机器学习,用除了房屋价格之外的其他因素(房屋高度/房屋面积等)来预测一套房子的价格。objective:用除了房屋总价和房屋单位...

发表了文章 • 2019-03-08 10:30 • 0 条评论

0
推荐
1558
阅读

零基础:R必知必会

作者:herain  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/herain-14个人公众号:趣味数据周刊1:给矩阵 matrix1_1 添加行名称/列名称1dimnames(matix1_1)<list(c(行,名,称), c(列,名,称))2:安装包时,指定镜像地址1install.packages("showtext",repos="http://mirrors.ustc.edu.cn/...

发表了文章 • 2019-03-07 10:32 • 0 条评论

0
推荐
2027
阅读

R语言自然语言处理:词性标注与命名实体识别

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com原理简介在之前的文章中(R语言自然语言处理:中文分词)介绍了如何利用jiebaR来做中文分词,这次希望研究如果利用R语言来做词性标注,并利用标注...

发表了文章 • 2019-03-06 10:10 • 0 条评论

0
推荐
1574
阅读

是否,是否,总是富肥穷瘦?

作者:herain  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/herain-14个人公众号:趣味数据周刊本篇统计学知识点:统计描述:统计量包括:衡量中心趋势的均值、中位数、众数,衡量相对位置的分位数,衡量离散程度的方差和标准差,以及衡量相关性的Pearson相关系数。统计图则包括直方图、ECDF图、箱...

发表了文章 • 2019-03-05 10:50 • 0 条评论

0
推荐
1531
阅读

精选|2019年1月R新包推荐

作者:Joseph Rickert翻译:黄小伟,10年资深数据矿工。目前就职杭州有赞,欢迎加入有赞分析团队2019年1月,153个R新包收录于CRAN!以下是选摘的40个R新包,包括八个类别:计算方法、数据、机器学习、医学、科学、统计学、工具和可视化。一. 计算方法1. cPCG: 提供使用共轭梯度算法求解线性方程组的函数.2. RcppDynProg:...

发表了文章 • 2019-03-04 09:45 • 0 条评论

0
推荐
1756
阅读

R爬虫小白入门:Rvest爬链家网+分析(二)

作者:汪喵行  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/yhannahwang前言上面一章我们已经成功爬取了链家网的数据。按照同样的方法爬取,又成功爬取了3w条上海二手房源的数据,那么这一章就写写关于上海二手房的分析。用到的软件:R,Tableau一开始还是在R中画的图,后来觉得不是很好看,所以用...

发表了文章 • 2019-03-04 09:41 • 0 条评论

0
推荐
1625
阅读

R语言基于S3的面向对象编程

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言对于R语言的面向对象编程,不同于其他的编程语言,R语言提供了3种底层对象类型,一种是S3类型,一种是S4类型,还有一种是RC类型。S3对象...

发表了文章 • 2019-02-27 10:35 • 0 条评论

0
推荐
1514
阅读

R语言ETL系列:过滤(filter)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com前言本章节介绍如何根据条件对表格进行过滤,主要使用filter函数进行实现。首先加载需要的包和数据,我们会用到R语言自带的mtcars数据集。首先我...

发表了文章 • 2019-02-25 10:22 • 0 条评论

0
推荐
3043
阅读

R_空间插值_必知必会(二)

作者:李誉辉  四川大学在读研究生前言本文是R空间插值—必知必会的最后一篇,上一篇请戳:R_空间插值_必知必会(一)6、ggplot2绘图6.1rasterLayer转化为dataframe 1library(raster) 2library(sp) 3library(dplyr) 4library(magrittr) 5 6# 定义一个函数,将rasterLayer栅格数据转化为data.frame 7# 将r...

发表了文章 • 2019-02-22 10:09 • 0 条评论