4
推荐
2249
阅读
2017,感谢一起,2018,一起出发
2017,感谢R语言社区和天善的小伙伴与我们在一起,2018,让我们再一起出发,再续辉煌。2017年,依然是忙碌的一年:工作、写书、参加会议、写文章、录视频、......1、写书:自己撰写的《R语言游戏数据分析与挖掘》终于在2017年7月出版,本书从实际应用出发,结合实例及应用场景,通过对大量案例进行详细阐述和深入分析,...
3
推荐
2158
阅读
利用R语言做可重复性报告研究
插入R代码样例展示:---
title: "R代码块"
output: html_document
---
### 不显示warnings信息
```{r,warning=FALSE}
a <- 1:4
b <- 1:3
a +b
```
***
#### 不显示代码
```{r,fig.align='left',echo=FALSE}
library(recharts)
g <- echartr(iris, Sepal.Width, Petal.Width, series =Speci...
0
推荐
2003
阅读
利用R语言做可重复性报告研究
插入R代码样例展示:---
title: "R代码块"
output: html_document
---
### 不显示warnings信息
```{r,warning=FALSE}
a <- 1:4
b <- 1:3
a +b
```
***
#### 不显示代码
```{r,fig.align='left',echo=FALSE}
library(recharts)
g <- echartr(iris, Sepal.Width, Petal.Width, series =Species) %>%
setS...
9
推荐
2772
阅读
大作业一答案(利用算法识别风险欺诈用户)
作业一的数据量稍微有点大,目的就是为了考察学员对大数据的处理和建模能力。多位学员在做题过程中提到数据量大模型跑起来慢的问题,此时有学员提出利用并行方式跑模型的方式来解决大数据运行问题是一个非常好的思路。关于作业一的建模这边使用Microsoft R Service中的基于企业级大数据机器学习平台的MicrosoftML包中的...
3
推荐
2303
阅读
Win10无法安装Rattle问题解决方案
近期有比较多人遇到window10系统安装了Rattle包却无法使用的情况(R:3.4.1),只需要将原来安装的依赖包删除后执行以下命令:install.packages("https://cran.r-project.org/bin/windows/contrib/3.3/RGtk2_2.20.31.zip", repos=NULL)
install.packages("rattle")安装成功后,运行以下命令打开rattle:library(rattle)
...
5
推荐
2665
阅读
《R语言游戏数据分析与挖掘》新书推荐
《R语言游戏数据分析与挖掘》新书上市已经有一个多月,各大网店均有销售。这是一部从大数据技术和游戏业务双重维度讲解如何利用结果数据指导商业决策的实战性著作,乐逗游戏高级数据分析师撰写,是他近10年数据挖掘与分析经验的总结。数据是无价的,只有当数据被挖掘分析并帮助到企业的时候才是有价值的。传统的数据分析...
3
推荐
2675
阅读
《重在实战!十五大案例,开启R语言实战之门金钥匙》即将起航
社区有很多自学或者上过一些R语言的课程,掌握了R语言的用法,懂得调用函数实现某些算法。但是却缺少一些实际生产数据,对于如何将原始数据转化成能建模的数据还是缺少实战经验。下周二开启的《重在实战!十五大案例,开启R语言实战之门金钥匙》课程是从实际案例出发,结合自己多年在数据分析和挖掘领域的行业经验,尽量...
3
推荐
3772
阅读
igraph包快速上手
在R中,igraph包是专门用来处理网络图的。使用之前先通过install.packages("igraph")下载安装。igraph包非常容易创建各种常规图,其中包括无边图(make_empty_graph函数)、星形图(make_star函数)、环形图(make_ring函数)、完全图(make_full_graph函数)、树状图(make_tree函数)等图形。这些函数的用法都非常简单,读者请查...
4
推荐
3412
阅读
R语言之数据管理
数据挖掘最重要的一环就是如何管理你的数据,因为原始数据一般都不能直接用来进行分析,需要对原始数据进行增加衍生变量、数据分箱、数据标准化处理;对因子型变量进行哑变量处理;数据抽样和类失衡数据处理。本专题会详细介绍以上内容的数据挖掘技术及R语言实现。数据转换对于数据挖掘分析建模来说,数据转换(Transform...
2
推荐
2017
阅读
11
推荐
2549
阅读
突破R内存限制的企业级大数据挖掘利器:Microsoft R Server 快速上手
R语言是一款非常优秀的数据挖掘工具,拥有顶尖的数据处理、数据挖掘课数据可视化。是数据从业者必备的一把利器。但是其基于内存的诟病也一直被人所嫌弃,虽然这几年很多优秀的扩展包极大提升了R语言的性能,但是在面对企业级大数据挖掘面前,也会显得力不从心。现在我们也不用担心R语言这个问题了,自从微软收购了商业版...
16
推荐
1782
阅读
“数据达人”养成记
近年来,身边越来越多朋友跟我请教,如何快速成长为数据分析人员。其实学习没有捷径,如何合格的数据分析人员,让我们先看摘自《数据科学实战》一书中的关于数据科学技能与自我认知的主要元素:可见要想成为合格的数据分析师,我们需要具备一定的数学、统计学、计算机能力,还需要具备以下的数据处理、建模、可视化等扩...
10
推荐
4636
阅读
数据可视化实践之美(开篇)
开篇主要是介绍了一些常用的数据可视化工具和图表,让各位看官对数据可视化有一个较为全面的认识。后续篇章会深入介绍如何运用工具绘制精美图表的技术细节。随着DT时代的到来,传统的统计图表很难对复杂数据进行直观地展示。这几年数据可视化作为一个新研究领域也变得越来越火。成功的可视化,如果做得漂亮,虽表面简单...
4
推荐
3880
阅读
R访问数据库管理系统(通过RODBC包和RMySQL包两种方式)
R中有多种面向关系型数据库管理系统(DBMS)的接口,包括SQL Server、Access、MySQL、Oracle、DB2等。其中一些包通过原生的数据库驱动来提供访问功能,另一些则是通过ODBC或JDBC来实现访问的。使用R来访问存储在外部数据库中的数据是一种分析大数据集的有效手段,并且能够发挥SQL和R。一种方式是依赖RODBC包,该包使用开放...
17
推荐
1892
阅读
忙碌的2016年总结及2017年展望
回首2016,如白驹过隙,时间都去哪了,哎,又老一岁了%>_<%如果要对2016年进行总结,我觉得用幸运和忙碌这两个词进行概要最为恰当。幸运是因为在2016年认识了很多朋友,让我觉得在数据这条路上有很多同路人,并不孤单;也正是有这些朋友的鼓励和信任,才能在2016年6月份合著书籍《R语言与数据挖掘》如期出版,天善...