0
推荐
1899
阅读

windows定时自动运行R脚本的正确姿势

作者:Frank  山东大学环境研究院博士   R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/chen-xiao-tian-92-92  前言因为数据处理需要,写了汇总仪器每日原始数据的R语言代码。仪器每日凌晨自动生成一份前一日的原始数据,因此需要代码每日定时自动运行一次进行汇总更新。通过R脚...

发表了文章 • 2019-02-21 09:57 • 0 条评论

0
推荐
1822
阅读

用人工智能方法计算水果难题------遗传算法篇

作者:梁凯  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/liang-kai-77-98这次我们暂且不写爬虫,动态爬虫以后再写,因为这几天一直在纠结一个问题,这个问题就是水果难题,如图所示题目大言不惭说百分之九十五的人不能解决此问题,问题要我们找出苹果,香蕉,还有一个水果(是梨子?)的 正整数解...

发表了文章 • 2019-02-19 14:07 • 0 条评论

0
推荐
2573
阅读

R_空间插值_必知必会(一)

作者:李誉辉  四川大学在读研究生1、简介在气象等领域,空间插值非常重要,将观测站获取的数据汇总成点数据,然后通过插值将点数据插值为栅格数据,再用地图boundary筛选出在boundary内的栅格。最后将栅格数据添加到地图上。本次教程会涉及到很多sp和sf的知识,十分详细。地图绘制采用2018年的新包tmap,相比...

发表了文章 • 2019-02-18 13:32 • 0 条评论

0
推荐
1733
阅读

R语言ETL工程系列:排序(arrange)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com前言上篇介绍如何从表中检索一个或多个数据列,本章介绍如何在R中对表格数据进行排序,主要使用arrange函数。首先我们加载必要的包:1library(tid...

发表了文章 • 2019-02-18 13:26 • 0 条评论

0
推荐
1580
阅读

R语言实现聚类kmeans

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言聚类属于无监督学习中的一种方法,k-means作为数据挖掘的十大算法之一,是一种最广泛使用的聚类算法。我们使用聚类算法将数据集的点,分...

发表了文章 • 2019-02-18 13:25 • 0 条评论

0
推荐
1801
阅读

R语言:data.table语句批量生成变量

作者:村长,数据科学、指弹吉他及录音工程爱好者,浙大金融学博士在读,在data.table包和MongoDB的使用上有较多经验。写在前面本期依然由村长为大家供稿,只为填上一期最后挖的坑,话不多说进入正题。问题提出在上一期中,还记得我们留下的那个彩蛋吗?我们在对多列标准进行筛选时,在之前我们还进行了一步非常重要的提...

发表了文章 • 2019-02-18 13:24 • 0 条评论

0
推荐
6950
阅读

【R语言实用技巧】随机排序、随机抽样与分层抽样

作者:宋星云 中国科学院心理研究所硕士,R语言爱好者。已有多年数据分析与R语言的实战经验,毕业后将从事数据分析工作。个人公众号:星云实验室对给定的样本随机排序、随机抽样、分层抽样在日常生活工作中非常常见,本文将以若干案例来介绍实现这几种常见需求的简单解决方案。自带的 sample 函数是实现...

发表了文章 • 2019-02-18 13:21 • 0 条评论

0
推荐
1522
阅读

基于R实现统计中的检验方法---方差分析

作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。知乎:https://www.zhihu.com/people/parkson-19/posts前言方差分析(均数的显著性检验)方差分析(Analysis of Variance,简称ANOVA),又称“变异系数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。1.适用条件方差分析数...

发表了文章 • 2019-02-18 13:19 • 0 条评论

0
推荐
2409
阅读

R语言:以多列筛选特定行

作者:村长,数据科学、指弹吉他及录音工程爱好者,浙大金融学博士在读,在data.table包和MongoDB的使用上有较多经验。写在前面本期我们大猫二人组的村长在新的一年首先回归,为大家带来新的推送。在本期,我们会运用一个病例数据为大家进行讲解示范,这也是大猫课堂第一次针对阅读者提问进行的反馈,也希望大家能提供一...

发表了文章 • 2019-02-11 11:45 • 0 条评论

0
推荐
1814
阅读

精选|2018年12月R新包推荐

作者:Joseph Rickert翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,10年数据矿工。目前就职杭州有赞,欢迎加入有赞分析团队2018年12月,157个R新包收录于CRAN!以下是选摘的40个R新包,包括10个类别:计算方法、数据、金融、机器学习、医学、科学、统计学、时间序列、工具和可视化。值得注意的是,有4个R包出...

发表了文章 • 2019-02-11 11:41 • 0 条评论

0
推荐
1453
阅读

左手Python右手R —《白夜行》wordcloud

作者:胡言  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/hu-yan-81-25前言我的天空里没有太阳,总是黑夜,但并不暗,因为有东西代替了太阳。虽然没有太阳那么明亮,但对我来说已经足够。凭借着这份光,我便能把黑夜当成白天。你明白吗?我从来就没有太阳,所以不怕失去。”每每读完一本东野圭吾的...

发表了文章 • 2019-02-11 11:40 • 0 条评论

0
推荐
1666
阅读

R语言轻巧的时间包hms

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言时间是数据的基本维度,是在做数据处理的时候,必须要掌握的技术。根据时间周期的不同,通常把时间分为,年、月、日、时、分、秒、毫秒...

发表了文章 • 2019-02-11 11:37 • 0 条评论

0
推荐
1842
阅读

用R语言实现密度聚类dbscan

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言聚类是一种将数据点按一定规则分群的机器学习技术,k-Means聚类是被用的最广泛的也最容易理解的一种。除了K-Means的方法,其实还有很多...

发表了文章 • 2019-02-11 11:30 • 0 条评论

0
推荐
1384
阅读

R中的子集选取运算符

作者:张光耀,硕士研究生,现就读于中科院心理所,GitHub 主页: https://github.com/usplos前言R中的子集选区运算符主要包括<[ ]>,<[[ ]]>,<$>三种。其中<[ ]> 和 <[[ ]]> 相似,但是前者返回的是列表,后者返回的是列表中的内容。<$> 运算符与选定的字符串一起就成为 <...

发表了文章 • 2019-02-11 11:28 • 0 条评论

0
推荐
1703
阅读

当文科生遇见R语言,照样玩得转

作者:林筱越  华东政法大学 社会学专业 R语言爱好者 前言本文从一个自学者的视角并结合自身经历来谈一谈自己作为一个文科生如何从零基础开始学习R,并逐渐深入这一领域,可能存在不足之处,欢迎指正。阅读全文大约需要8~15分钟,全文内容结构如下:       一、文科...

发表了文章 • 2019-02-11 11:25 • 0 条评论