R语言中文社区

公众号:R语言中文社区。 国内最大的R语言专业学习平台| R官方学习实践社区,提供R核心网站学习、视频直播 、R核心学习资源库、R全球会议资讯等内容!

0
推荐
2592
阅读

R_空间插值_必知必会(一)

作者:李誉辉  四川大学在读研究生1、简介在气象等领域,空间插值非常重要,将观测站获取的数据汇总成点数据,然后通过插值将点数据插值为栅格数据,再用地图boundary筛选出在boundary内的栅格。最后将栅格数据添加到地图上。本次教程会涉及到很多sp和sf的知识,十分详细。地图绘制采用2018年的新包tmap,相比...

发表了文章 • 2019-02-18 13:32 • 0 条评论

0
推荐
1711
阅读

R语言网络爬虫经验

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com1读取1#假设url为网页2library(rvest)3read_html(rul)->website4#该方法对于html/shtml都好用56#可是网页为.aspx时候这个方法不行,改为7libra...

发表了文章 • 2019-02-18 13:31 • 0 条评论

0
推荐
1705
阅读

Google 的 OKR 制度与KPI 有什么不同?

作者:黄小伟,先后从事游戏、社交及金融数据研究及应用,10年数据矿工。目前就职杭州有赞,欢迎加入有赞分析团队OKR 的全称是“目标和主要成果” (Objectives and Key Results),这套系统由英特尔公司制定,在谷歌成立不到一年的时间,被投资者约翰·都尔 (John-Doerr) 引入谷歌,并一直沿用至今.一. 关于KPI1.KPI 理论上...

发表了文章 • 2019-02-18 13:30 • 0 条评论

0
推荐
2967
阅读

ggplot2图集汇总(一)

作者:路遥马亡  R语言中文社区专栏作者知乎ID:https://zhuanlan.zhihu.com/c_135409797前言上次推文小白R语言数据可视化进阶练习一汇总了一部分的图集,这次推文接上一篇再次汇总,此图集汇总将不断更新!08相关图相关图,通常分析多个因素之间的相关性时都会计算相关性系数,通过作图的方式,让相关性可视...

发表了文章 • 2019-02-18 13:29 • 0 条评论

0
推荐
1379
阅读

我与R语言的相识与相知

作者:张宜峤,刚入职场的小白,自学R语言两年1相识第一次听说R语言,来自我的大学老师,她说她的学生都用R语言,她劝编程零基础的我试试,只要踏实,一步一个脚印,不管多么简单的代码都要亲手实践,那么入门一点儿也不难,我将信将疑的相信了老师的话,即使怀疑自己能力不够,还是开始了自学的过程。2相知(我学R语言...

发表了文章 • 2019-02-18 13:28 • 0 条评论

0
推荐
1451
阅读

逻辑斯蒂回归:家庭买私家车的概率

作者:herain  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/herain-14前言我们讨论过因变量为数值型的一元线性和多元线性预测模型,今天我们来讨论定型变量的回归模型,定性变量可以说是一种类别变量,比如男/女,优/良/差,是/否,真/假,黑/白等,因变量的结果集是有限的,可预设的,定性变量的...

发表了文章 • 2019-02-18 13:27 • 0 条评论

0
推荐
1754
阅读

R语言ETL工程系列:排序(arrange)

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com前言上篇介绍如何从表中检索一个或多个数据列,本章介绍如何在R中对表格数据进行排序,主要使用arrange函数。首先我们加载必要的包:1library(tid...

发表了文章 • 2019-02-18 13:26 • 0 条评论

0
推荐
1600
阅读

R语言实现聚类kmeans

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言聚类属于无监督学习中的一种方法,k-means作为数据挖掘的十大算法之一,是一种最广泛使用的聚类算法。我们使用聚类算法将数据集的点,分...

发表了文章 • 2019-02-18 13:25 • 0 条评论

0
推荐
1813
阅读

R语言:data.table语句批量生成变量

作者:村长,数据科学、指弹吉他及录音工程爱好者,浙大金融学博士在读,在data.table包和MongoDB的使用上有较多经验。写在前面本期依然由村长为大家供稿,只为填上一期最后挖的坑,话不多说进入正题。问题提出在上一期中,还记得我们留下的那个彩蛋吗?我们在对多列标准进行筛选时,在之前我们还进行了一步非常重要的提...

发表了文章 • 2019-02-18 13:24 • 0 条评论

0
推荐
1442
阅读

分类回归树——来预测传说级的神奇宝贝吧

作者:horo  R语言中文社区专栏作者知乎ID:https://www.zhihu.com/people/lin-jia-chuan前言最近在Kaggle看到一个数据集,非常有趣,所以有个想法想介绍给大家,但由于比较忙,所以一直鸽到现在(就算是比较忙也偷偷看了EVA,EVA最高)好了,废话不多说。直接开始吧。决策树最早源于人工智能的机器学习技术,因其具...

发表了文章 • 2019-02-18 13:22 • 0 条评论

0
推荐
7043
阅读

【R语言实用技巧】随机排序、随机抽样与分层抽样

作者:宋星云 中国科学院心理研究所硕士,R语言爱好者。已有多年数据分析与R语言的实战经验,毕业后将从事数据分析工作。个人公众号:星云实验室对给定的样本随机排序、随机抽样、分层抽样在日常生活工作中非常常见,本文将以若干案例来介绍实现这几种常见需求的简单解决方案。自带的 sample 函数是实现...

发表了文章 • 2019-02-18 13:21 • 0 条评论

0
推荐
1554
阅读

基于R实现统计中的检验方法---方差分析

作者:徐涛,19年应届毕业生,专注于珊瑚礁研究,喜欢用R各种清洗数据。知乎:https://www.zhihu.com/people/parkson-19/posts前言方差分析(均数的显著性检验)方差分析(Analysis of Variance,简称ANOVA),又称“变异系数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。1.适用条件方差分析数...

发表了文章 • 2019-02-18 13:19 • 0 条评论

0
推荐
2142
阅读

用R语言实现信息度量

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言香农的《通信的数学理论》是20世纪非常伟大的著作,被认为是现代信息论研究的开端。信息论定义了信息熵,用于把信息进行度量,以比特(bi...

发表了文章 • 2019-02-11 12:12 • 0 条评论

0
推荐
2436
阅读

R语言:以多列筛选特定行

作者:村长,数据科学、指弹吉他及录音工程爱好者,浙大金融学博士在读,在data.table包和MongoDB的使用上有较多经验。写在前面本期我们大猫二人组的村长在新的一年首先回归,为大家带来新的推送。在本期,我们会运用一个病例数据为大家进行讲解示范,这也是大猫课堂第一次针对阅读者提问进行的反馈,也希望大家能提供一...

发表了文章 • 2019-02-11 11:45 • 0 条评论

0
推荐
1836
阅读

精选|2018年12月R新包推荐

作者:Joseph Rickert翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,10年数据矿工。目前就职杭州有赞,欢迎加入有赞分析团队2018年12月,157个R新包收录于CRAN!以下是选摘的40个R新包,包括10个类别:计算方法、数据、金融、机器学习、医学、科学、统计学、时间序列、工具和可视化。值得注意的是,有4个R包出...

发表了文章 • 2019-02-11 11:41 • 0 条评论