1
推荐
2533
阅读

tidyverse —— forcats包

forcats包用于处理因子,可以更高效地对因子进行修改。1. 生成因子R语言的base包中函数如dataframe等默认因子在分类变量读入时就会生成,而tidyverse包中的readr等包则会保留数据读入时的原样不做改变,要生成因子则可以使用parse_factor函数进行处理。parse_factor函数更审慎一些,会对不在给定的因子水平中的变量取值...

发表了文章 • 2018-08-26 01:27 • 0 条评论

0
推荐
2009
阅读

tidyverse —— stringr包

stringr包,顾名思义,处理字符串专用包,本篇笔记对它进行简单介绍。提到字符串处理,有一个绕不过去的主题,它是字符串处理的利器,也是字符串处理的问题制造机,它就是——正则表达式。本篇笔记顺带介绍一下正则表达在R语言中的应用。1.  连接字符串在base包中,字符串的连接主要用paste和paste0两个函数,在...

发表了文章 • 2018-07-29 22:55 • 0 条评论

1
推荐
2085
阅读

tidyverse —— tidyr包

tidyr包,tidyverse工具箱中的改锥和锤子,哪儿不顺眼修哪里,犀利得好比找茬儿的老板,专注把数据在长和宽的形态中互转,功能类似reshape2包,本篇顺带也回顾一下reshape2包。1. reshape2包1.1 melt函数以airquality数据为例,先把变量名全改成小写,方便之后的处理names(airquality) <- tolower(names(airquality))...

发表了文章 • 2018-07-23 00:26 • 0 条评论

2
推荐
1710
阅读

tidyverse —— readxl包

readxl包,读取Excel文件专用包,有和tidyverse核心包一样的特点,快!效率特高!话说Hadley大叔出品就没有效率低的,可能键盘是借来的,着急还。独立性高,不外部依赖Java啥的,xls和xlsx文件读取都可以。library(readxl)一个提醒,因为本包不是tidyverse的核心包,所以,不像readr包一样,library(tidyverse)后就可以...

发表了文章 • 2018-04-16 23:32 • 2 条评论

4
推荐
2496
阅读

tidyverse —— readr包

readr包用于读取数据。相比于base包,其优势在于速度快,能提速十余倍;相比于data.table包,其速度稍有逊色,作者Hadley大叔表示,差个1.2到2倍速度的样子,但是,在读取过程中能对数据进行更加精细的解析。下面介绍其主要函数。主要参考R for Data Science一书,http://r4ds.had.co.nz/data-import.html#getting-start...

发表了文章 • 2018-04-09 21:07 • 4 条评论

2
推荐
2397
阅读

tidyverse —— dplyr包

tidyverse包tidyverse是一个汇总包,一包更比6包强,用于数据清洗、转换、可视化等。tidyverse_packages() #列示tidyverse中所有的包其核心包有ggplot、readr、tibble、purrr、 tidyr  、dplyr、ggplot、forcats 和stringr8个,本篇主要讲dplyr这一个。dplyr包主要操作函数dplyr包用于数据处理。整体而言,...

发表了文章 • 2018-04-02 20:31 • 0 条评论