1
推荐
2533
阅读
tidyverse —— forcats包
forcats包用于处理因子,可以更高效地对因子进行修改。1. 生成因子R语言的base包中函数如dataframe等默认因子在分类变量读入时就会生成,而tidyverse包中的readr等包则会保留数据读入时的原样不做改变,要生成因子则可以使用parse_factor函数进行处理。parse_factor函数更审慎一些,会对不在给定的因子水平中的变量取值...
0
推荐
2009
阅读
tidyverse —— stringr包
stringr包,顾名思义,处理字符串专用包,本篇笔记对它进行简单介绍。提到字符串处理,有一个绕不过去的主题,它是字符串处理的利器,也是字符串处理的问题制造机,它就是——正则表达式。本篇笔记顺带介绍一下正则表达在R语言中的应用。1. 连接字符串在base包中,字符串的连接主要用paste和paste0两个函数,在...
1
推荐
2085
阅读
tidyverse —— tidyr包
tidyr包,tidyverse工具箱中的改锥和锤子,哪儿不顺眼修哪里,犀利得好比找茬儿的老板,专注把数据在长和宽的形态中互转,功能类似reshape2包,本篇顺带也回顾一下reshape2包。1. reshape2包1.1 melt函数以airquality数据为例,先把变量名全改成小写,方便之后的处理names(airquality) <- tolower(names(airquality))...
2
推荐
1710
阅读
tidyverse —— readxl包
readxl包,读取Excel文件专用包,有和tidyverse核心包一样的特点,快!效率特高!话说Hadley大叔出品就没有效率低的,可能键盘是借来的,着急还。独立性高,不外部依赖Java啥的,xls和xlsx文件读取都可以。library(readxl)一个提醒,因为本包不是tidyverse的核心包,所以,不像readr包一样,library(tidyverse)后就可以...
4
推荐
2497
阅读
tidyverse —— readr包
readr包用于读取数据。相比于base包,其优势在于速度快,能提速十余倍;相比于data.table包,其速度稍有逊色,作者Hadley大叔表示,差个1.2到2倍速度的样子,但是,在读取过程中能对数据进行更加精细的解析。下面介绍其主要函数。主要参考R for Data Science一书,http://r4ds.had.co.nz/data-import.html#getting-start...
2
推荐
2398
阅读
tidyverse —— dplyr包
tidyverse包tidyverse是一个汇总包,一包更比6包强,用于数据清洗、转换、可视化等。tidyverse_packages() #列示tidyverse中所有的包其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个,本篇主要讲dplyr这一个。dplyr包主要操作函数dplyr包用于数据处理。整体而言,...
0
推荐
1272
阅读
R的更新
installr用installr包来进行更新。install.packages("installr")
require(installr)
updateR()最后一步在RGUI中进行。anaconda创建r环境,再更新升级所有包update.packages(ask = FALSE)