R语言中文社区

公众号:R语言中文社区。 国内最大的R语言专业学习平台| R官方学习实践社区,提供R核心网站学习、视频直播 、R核心学习资源库、R全球会议资讯等内容!

0
推荐
1436
阅读

R语言模拟:Bias Variance Trade-Off

作者:量化小白一枚,上财研究生在读,偏向数据分析与量化投资个人公众号:量化小白上分记 本文主要是对机器学习算法误差的分解,全文包括理论推导和模拟两部分。1. 理论推导如何评价机器学习算法的性能,是一个非常重要的问题,目前已有很多方法,基本思路都是用样本误差去估计泛化误差,简单的有将样本分为测试集和...

发表了文章 • 2018-12-03 16:07 • 0 条评论

0
推荐
1163
阅读

相关矩阵可视化 – corrplot() 绘图

作者:张光耀,硕士研究生,现就读于中科院心理所GitHub主页 :https://github.com/usploscorrplot 是实现相关矩阵可视化的包,在Rstudio中,可直接下载install.packages(‘corrplot’)       这里我们使用psych数据包中的USJudgeRatings数据,包含了律师对美国高等法院法官...

发表了文章 • 2018-12-03 16:06 • 0 条评论

0
推荐
1427
阅读

R与Python手牵手:特征工程(数值型变换)¶

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com经常玩数据竞赛的人几乎达成了一个共识,就是建模过程大家都大同小异,但是特征工程则至关重要。数据和特征决定了机器学习的上限,而模型和算法只...

发表了文章 • 2018-12-02 19:47 • 0 条评论

0
推荐
1687
阅读

R_ggplot2基础(四)

作者:李誉辉  四川大学在读研究生 往期连载:R_ggplot2基础(一)R_ggplot2基础(二)R_ggplot2基础(三)9 Guides图例与增加坐标轴图例函数:* guide_colorbar()/guide_colourbar() 用于连续变量的图例* guide_legend() 用于离散变量的图例,也可以用于连续变量* guides(...

发表了文章 • 2018-11-29 13:54 • 0 条评论

0
推荐
1855
阅读

R_ggplot2基础(三)

作者:李誉辉  四川大学在读研究生 7 scale_xxx()标度调整标度用于控制变量映射到视觉对象的具体细节,如坐标轴标签和图例视觉对象分为:坐标轴,alpha透明度,color/fill颜色,date/time时间轴, hue色相, grey灰度,shape点形, size尺寸, linetype线型, radius半径, area面积它们都有相应的标度函数...

发表了文章 • 2018-11-28 19:31 • 0 条评论

1
推荐
1813
阅读

R与Python手牵手:数据探索性分析案例展示

作者:黄天元,复旦大学博士在读,目前研究涉及文本挖掘、社交网络分析和机器学习等。希望与大家分享学习经验,推广并加深R语言在业界的应用。邮箱:huang.tian-yuan@qq.com通常,我们拿到一份数据不能马上分析,要先搞清楚这份数据的特点是什么。探索性数据分析就是为了解决这个问题而设计的,下面我们通过一个案例进行...

发表了文章 • 2018-11-28 13:59 • 0 条评论

0
推荐
1751
阅读

R语言实战:个人贷款违约预测模型

作者:花花_Angel   R语言爱好者,R语言中文社区原创作者一、项目背景本项目使用R语言对银行的个人金融业务数据进行分析,以对个人贷款是否违约进行预测。帮助业务部门及时发现问题,以避免损失。二、数据说明本项目数据集来自《数据科学实战:Python篇》。数据集包含8个表:账户表accounts、信用卡表card、客...

发表了文章 • 2018-11-27 10:27 • 0 条评论

0
推荐
1143
阅读

从一件数据清洗的小事说起

写在前面“ 转载自公众号:大猫的R语言课堂村长,数据科学、指弹吉他及录音工程爱好者,浙大金融学博士在读,在data.table包和MongoDB的使用上有较多经验。问题:从一段json清晰代码说起笔者某一日在R语言中文社区某一群里面发现了水友提出的一个问题,处理一个比较奇葩的数据清洗问题,先来看数据结构:这是一个类j...

发表了文章 • 2018-11-27 10:26 • 0 条评论

0
推荐
2971
阅读

技术贴│R语言13种相关矩阵图

郑连虎,在数学学院取得理学学位的文科生,中国人民大学硕博连读生在读,山东大学管理学学士、理学学士个人公众号:阿虎定量笔记文章(技术贴│Stata回归图表美化)推送之后,有读者问我,能不能给相关系数的报告也美化一下?当然没问题,这期我来介绍用R语言中的5个程序包,绘制13种相关系数矩阵,13种哦~图后直接上代码...

发表了文章 • 2018-11-27 10:25 • 0 条评论

0
推荐
1352
阅读

R语言预测shibor走势:prophet

  作者:甄世达   大数据从业者,R语言爱好者 很早就拿R语言想做时间序列预测,试了试forecast库,太麻烦了,对初学者很不友好。最近发现一个新的库prophet,拿来一试效果非常好,而且简单,速度也不慢。我是先把数据导入oracle数据库,然后使用odbc连接数据库,如果你喜欢,改用roracle也可以...

发表了文章 • 2018-11-24 10:05 • 0 条评论

0
推荐
1896
阅读

R_ggplot2基础(二)

作者:李誉辉  四川大学在读研究生 往期连载:R_ggplot2基础(一)5 stat_xxx()统计变换相比几何对象,增加了:统计变换函数描述其它stat_bin直方图分割数据,然后绘制直方图stat_function函数曲线增加函数曲线图stat_qqQ-Q图stat_smooth平滑曲线stat_ellipse椭圆常用于椭圆形置信区间,带状置信区...

发表了文章 • 2018-11-23 12:32 • 0 条评论

0
推荐
1730
阅读

用R语言实现数据离散化

作者:张丹,R语言中文社区专栏特邀作者,《R的极客理想》系列图书作者,民生银行大数据中心数据分析师,前况客创始人兼CTO。个人博客 http://fens.me, Alexa全球排名70k。前言在做数据挖掘模型的时候,我们有时会需要把连续型变量转型离散变量,这种转换的过程就是数据离散化,分箱就是离散化常用的一种方法。数...

发表了文章 • 2018-11-22 13:31 • 0 条评论

2
推荐
1973
阅读

R_ggplot2基础(一)

作者:李誉辉  四川大学在读研究生 1 ggplot2特点采用图层的设计方式,有利于结构化思维将表征数据和图形细节分开,能快速将图形表现出来,使创造性绘图更加容易,而不必纠结于图形的细节,细节可以后期慢慢调整将常见的统计变换融入到了绘图中有明确的起始(ggplot开始)与终止(一句话一个图层),图...

发表了文章 • 2018-11-20 19:34 • 0 条评论

0
推荐
5220
阅读

基于R语言进行Box-Cox变换

作者:吴健 中国科学院大学 R语言、统计学爱好者,尤其擅长R语言和Arcgis在生态领域的应用分享个人公众号:统计与编程语言 Q:为什么要进行Box-Cox转换?A:Box-Cox是一种广义幂变换,统计建模中常用的变换,用于连续响应变量不满足正态时的情况。Box-Cox的一个显著的有点是通过求变参数λ来确定变换形式,而这个过程...

发表了文章 • 2018-11-19 18:55 • 0 条评论

0
推荐
2025
阅读

R语言时间序列分析

郑连虎,在数学学院取得理学学位的文科生,中国人民大学硕博连读生在读,山东大学管理学学士、理学学士个人公众号:阿虎定量笔记方法简介时间序列是按时间顺序的一组数字序列。时间序列分析(time series analysis)就是利用这组数列,基于随机过程理论和数理统计学方法加以处理,以预测未来事物的发展。时间序列分析是...

发表了文章 • 2018-11-19 18:51 • 0 条评论