Data Analysis的博客专栏

统计专业学生、对R比较感兴趣,分享R知识

4
推荐
3164
阅读

R|ggplot2(一)|一个完整的绘图流程

这一块内容包括如下几个部分首先简单画一个图出来做一些等价调整接受另一种类型的数据简单的参数调整纵坐标使用百分比表示更改横纵轴坐标、标题等在图中增加标注的文字调整字体、背景等,达成excel的效果保存图形首先简单画一个图出来# 我们拿到这样的数据 name <- c("多","中","少","中","少") data <- data.fram...

发表了文章 • 2017-05-23 15:29 • 0 条评论

0
推荐
1948
阅读

R数据处理|data.table篇(三)

本文为data.table包介绍最后一篇,前两篇链接如下R数据处理|data.table篇(一) - 知乎专栏R数据处理|data.table篇(二) - 知乎专栏本文主要讲解data.table包中一些比较不常用的函数,还有data.table包高效的深层原理。下面是本文目录其他函数改进了的函数options设置性能之Secondary indices and auto indexing性能之f...

发表了文章 • 2017-05-08 15:30 • 0 条评论

1
推荐
2254
阅读

R数据处理|data.table篇(二)

上文我们讨论到使用data.table包完成数据分析框架,遗留如下几个问题增添列,另外一种删除列的方法,修改数据框计算或分组计算时,可不可以一次对所有列进行计算,而不需要再每一列都指定(.SD)DT中可不可以按照行名来提取(key)普通合并数据框(改进了的函数,会在下一篇中介绍)融合重铸本文介绍data.table包更深入的...

发表了文章 • 2017-05-08 15:17 • 0 条评论

5
推荐
1920
阅读

R数据处理|data.table篇(一)

概述data.table包是一个超高性能处理包,在数据处理上代码异常简洁,速度非常快。由于data.table的语法主要基于[],有些用法和基础函数会不一致,所以没有放在前面两个专题中一起讲,而是单独拿出来讲。在这个系列里,我会详细说明data.table和基础函的差异,并系统地讲解data.table包的用法。data.table的使用基本上是...

发表了文章 • 2017-04-17 15:56 • 0 条评论

2
推荐
2113
阅读

R数据处理|基础篇(二)

先用几个问题检验一下你是否需要看这篇文章dplyr包中如何批量筛选变量做汇总计算,知不知道有summarise_all at 这类函数reshape2包中的融合重铸和分组计算有什么关联tidyr 包的使用Hadley 大神本文介绍数据处理上的其他方面,和上一篇文章合在一起就可以组成处理数据的一个完整的系统。本文目录如下数据框合并拼接...

发表了文章 • 2017-04-07 11:17 • 0 条评论

3
推荐
1630
阅读

R数据处理|基础篇(一)

先用几个问题检验一下你是否需要看这篇文章高效处理数据R包 dplyr提取数据到底有哪些方法使用 $ 提取数据模糊匹配数据框提取数据时,有时候得到的是数据框,有时候是向量,这种数据自动降维是怎么回事管道操作函数在使用R做数据分析的一个完整的过程包括数据的获取,数据的前期处理,之后才是使用“整齐”的数据来套...

发表了文章 • 2017-04-07 11:15 • 0 条评论

0
推荐
1324
阅读

Rpy|字符串处理|总结与进阶

本专题总结本专题一共四篇文章,这是第四篇,在这里对前三篇文章进行总结,再进行进一步的分析,最后说一些更高级的字符串处理。字符串处理综述篇:主要讲述本专题字符串处理学习的基本思路,列出学习框架,给出R与python字符串处理的各种资源。同时给出了一个在学习上普世的方法论,虽然放在字符串处理这个专题下面,但...

发表了文章 • 2017-04-07 11:14 • 1 条评论

2
推荐
1178
阅读

Rpy|字符串处理|py篇

本文是字符串处理专题的第三篇文章,主要讲述python在字符串处理中的应用,主要分为使用字符串方法和re库、还有pandas库两个部分。事先声明,本文不是具体讲字符串处理的函数使用,而是从知识体系的角度来讲述字符串处理学习的框架,而具体、细节的学习资源见下面这个链接。同时本文讲述的思路也在本专题的第一篇文章中...

发表了文章 • 2017-04-06 10:41 • 0 条评论

0
推荐
1528
阅读

Rpy|字符串处理|R篇

根据框架讲述这里还是放上这幅学习框架的图片,以下是我们需要处理的内容本篇文章框架化讲述思路可以参考专题第一篇文章因为R基础函数大都即支持向量化操作,所以下面以字符串向量为例,换成单个字符串也可以。拼接、拆分和替换a <- c("2016-2-7","2016-3-8","2016-4-9","2017-5-10") b <- c("ahdbca","bhdafb") ...

发表了文章 • 2017-04-06 10:40 • 0 条评论

1
推荐
1816
阅读

Rpy|字符串处理|综述

专题定位本专题会对R和python的字符串处理部分进行系统的讲解。读者可能会问,无论是R还是python的字符串处理,网上都能找到非常多非常系统的教程,我们这个专题有什么特别的地方呢?本专题可以说是系统之上的系统化,我非常希望更多的人可以掌握这种学习思路,这种学习方法可以应用到其他方方面面。所以在我看来,与其...

发表了文章 • 2017-04-05 11:49 • 0 条评论

3
推荐
1918
阅读

R|基础绘图

由于R语言基础作图部分内容简单直接,但参数繁多,因此这里不做系统介绍,只挑出几个点来讲一讲。主要介绍R中的颜色系统。目录一个作图示例图片的高清保存par函数使用技巧颜色系统作图使用中文乱码基础作图和数学公式的演示一个作图示例下面我们要画出以上图片,当做一些函数和参数使用的例子,代码中的注释会对一些内容...

发表了文章 • 2017-04-05 11:45 • 1 条评论

2
推荐
1188
阅读

R深入|数据类型

学过R语言都知道,数据类型有向量、矩阵、数据框、列表。知道这些就可以使用,不过如果不更深入地了解,很可能会产生一些困惑。例如为什么 as.vector 函数不能将列表转化为向量?向量带有名字是怎么回事?怎么处理?class, typeof, mode到底有什么区别?(本文有一些代码结果没有列出来,建议在电脑上边运行R边看)下面...

发表了文章 • 2017-04-04 18:18 • 0 条评论

0
推荐
888
阅读

开篇综述

如今大数据非常热门,但是要想真正很好地利用数据却不容易,找数据、数学推导、软件计算、可视化展示,每一个方面都不轻松。本专栏主要讲述这个过程中软件的使用,目前以R语言和python为主,逐渐会渗透到其他软件,比如数据库,git等。使用R语言做数据分析,虽然说它是一门编程语言,但是它和平常的编程有很大差别。它没...

发表了文章 • 2017-04-04 18:17 • 0 条评论