1
推荐
1422
阅读

RStudio | R语言应用及发展峰会(精华分享)

会议说明:RStudio | R语言应用及发展峰会(佛罗里达)(1)时间:2017年1月12-14日(2)地点:佛罗里达州基西米盖洛德的度假胜地(3)主页:https://www.rstudio.com/(4)演讲嘉宾:   1)Max Kuhn, Senior Director Non-Clinical Statistics, Pfizer   2) Dirk Eddelbuettel, Ketchum Trading:&...

发表了文章 • 2017-01-29 12:49 • 0 条评论

2
推荐
2635
阅读

利用R语言制作出14种漂亮的交互数据可视化

作者:谢佳标  数据分析与挖掘R语言十三式,打造R全栈专家  https://edu.hellobi.com/classroom/1利用R语言也可以制作出漂亮的交互数据可视化,下面和大家分享一些常用的交互可视化的R包。rCharts包说起R语言的交互包,第一个想到的应该就是rCharts包。该包直接在R中生成基于D3的Web界面。rCharts包的安装:re...

发表了文章 • 2017-01-27 08:43 • 0 条评论

2
推荐
2100
阅读

Sparklyr 0.5 已在CRAN正式发布

Sparklyr 0.5 包已经在CRAN正式发布,新的版本在以下几个方面做了优化:1)加强对dplyr支持,如do( )和n_distinct( )2)增加新的函数,如sdf_quantile( )、ft_tokenizer( )、ft_regex_tokenizer( )3)强化对R的兼容性,如缺失值na.action、dim( )、nrow( )、ncol( )4)spark.rstudio.com 上部署新的案例等其他的最...

发表了文章 • 2017-01-26 09:25 • 0 条评论

1
推荐
1980
阅读

吉林说R系列 | 第六篇:分类问题

本人一直向往那种指点江山的人的霸气,却只能望其项背,从未能够达到。最近R语言大会开的如火如荼,一场又一场不停歇,可惜我都没有去参加,那都是牛人、大咖的海天盛宴啊。每每看到大咖在群里说bootstrap、随机森林、决策树、支持向量机之类的,都感觉无比的崇拜。如果有一天能够和他们坐在一起聊人生应该是件非常不错...

发表了文章 • 2017-01-20 11:03 • 0 条评论

3
推荐
1781
阅读

吉林说R系列 | 第五篇:数据管理

前些日子,一位贾姓朋友加我微信,问R语言中数据管理的问题,其实多多少少在前面的几篇文当中都有涉及了,今天索性来个系统的介绍,以抛砖引玉,还请各位大神不吝赐教。今天要讲的内容主要分成两个部分,基本数据管理和高级数据管理。一、基本数据管理我们都知道数据分析的前提就是把数据处理好。数据的读写之前已经说过...

发表了文章 • 2017-01-20 10:58 • 0 条评论

2
推荐
1213
阅读

吉林说R系列——第四篇:如何学习R语言

本文作者:王吉林现在对R感兴趣的人越来越多,很多人都想快速的掌握R语言,然而,由于目前大部分高校都没有开设R语言课程,这就导致很多人不知道如何着手学习R语言。有幸的是,作者在暨南大学统计学系攻读研究生期间,王斌会教授开设了R语言相关课程,对R语言有了初步的认识,后来临近毕业,加入了人大经济论坛做版主,...

发表了文章 • 2017-01-19 13:30 • 0 条评论

1
推荐
3026
阅读

吉林说R系列第三篇(下):数据的分布、处理及模拟

本文作者:王吉林(十一)指数分布指数函数的一个重要特征是无记忆性(Memoryless Property,又称遗失记忆性)。这表示如果一个随机变量呈指数分布,当s,t>0时有P(T>t+s|T>t)=P(T>s)。即,如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少s+t小时的条件概率,与从开始使用时算起它使用至少s小时...

发表了文章 • 2017-01-19 13:28 • 0 条评论

4
推荐
4345
阅读

吉林说R系列第三篇(上):数据的分布、处理及模拟

引言最近常看papi酱的周一放送,觉得很喜欢,她每次都可以从不同的角度,用欢乐的、幽默的、讽刺的语言搭配搞笑的、发人深省的动作揭示生活中各种现实问题,将事情的本质及人们在社会生活中的各种状态以简单、容易接受的方式表达出来。乍一看,你可能会觉得她有点怪怪的,但是细细体味,她说的不是很有道理吗?也许很少...

发表了文章 • 2017-01-18 17:22 • 0 条评论

3
推荐
1729
阅读

吉林说R系列第二篇:如何进行数据读写

1.引言本周在刷微博的时候看到一篇博文叫做《一个农村女孩的自由》,写的真实感人,其内容折射出了中国农村很长一段时间的现状。人生的选择很多,选择代表了对某种事物的把握,也注定要失去另一些领域的体验,这就是机会成本。无论农村女孩是遵循父母的旨意辍学打工挣钱盖新房,然后结婚生子打麻将抑或是变土豪,还是咬...

发表了文章 • 2017-01-18 17:11 • 0 条评论

4
推荐
1915
阅读

吉林说R图系列|第一篇:如何绘制各类图形

引言六月一个星期六的晚上,我静静地坐在顺德图书馆文筑书店的一张书台前看书,伸懒腰之际,无意间看到了龙应台的书籍(人生三本书),我随手拿起其中的一本——《目送》开始浏览,平实的文字却触动了我内心的灵魂。一种感伤的情绪在身体里慢慢沸腾,像吸了内功,走火入魔似的上蹿下跳。一晃毕业好多年了,离三十岁也仅有...

发表了文章 • 2017-01-18 17:08 • 0 条评论

1
推荐
2719
阅读

R语言| 使用REmap绘制超炫酷的地图

  REmap这个包是通过调用百度地图API的一个程序包,与Google的ggmap包相比,不用翻墙就可以使用。其函数主要有:remap(),remapB()、remapC()、remapH()四个。该程序包目前要github网站上,因此我们需要从github上面下载安装。install.packages("devtools")#如果安装了就不需要这步 library(devtools) install_gith...

发表了文章 • 2017-01-17 10:00 • 0 条评论

4
推荐
2102
阅读

借助caret包实现特征选择的工作

前言我们有一期的文章讲述了如何使用caret包进行数据的预处理,其中内容包括哑变量的创建、近零方差变了的筛选、数据标准化、缺失值处理、数据分割等。可以在教你使用caret包(一)--数据预处理获取更详细的内容介绍。下面我们接着讲讲如何使用caret包实现特征选择的任务。特征选择的实质就是在已有的变量基础上,选择部分...

发表了文章 • 2017-01-16 19:36 • 0 条评论

1
推荐
1891
阅读

用数据解读摩羯智投

前言进入2016年,伴随世界经济危机的到来,中国互联网创业,也在经历长时间的寒冬,有不少的公司都因资金链断裂,停止了运营。与寒冬反差很大的是,AI技术却火了起来,受到资本的追捧。智能投顾作为金融领域的AI热点,一直在持续升温。到2016年底,招商银行发布了一个名为“摩羯智投”的应用,一下子吸引了众多人的眼球,...

发表了文章 • 2017-01-16 19:30 • 0 条评论

1
推荐
2383
阅读

15分钟学会数据地图分析

什么都不说,先上一张最终的数据地图效果图,热力图部分是目标用户的分布,紫色和蓝色的购物车表示2种类型的商业购物场所。而深浅不一的蓝色格子块则代表房价。图1 最终效果图那么问题来了:这张图的制作需要哪些数据?你能从这张图上得到哪些信息?这张图能用到哪些地方?如果你对上述3个问题摸不着头脑,那很正常,因为这...

发表了文章 • 2017-01-16 15:00 • 0 条评论

1
推荐
2558
阅读

运用R分析全唐诗与全宋词

宋词词云分析步骤主要由三部分构成:资料收集、词频统计、对比分析从网上共搜集唐诗4.8万首,宋词1400首;进过预处理过程之后,对其进行分词与词频统计,各取其词频数前50的词,罗列如下:再直观点,来个当今流行的词云图展示一下唐宋年代各自的流行词汇:唐诗词云宋词词云好了,数据准备工作算是完成了,接下来开始分析...

发表了文章 • 2017-01-16 14:42 • 0 条评论