tidyverse 文章分类团子的进阶历程 - 天善智能：专注于商业智能BI和数据分析、大数据领域的垂直社区平台

1

推荐

2533

阅读

tidyverse —— forcats包

forcats包用于处理因子，可以更高效地对因子进行修改。1. 生成因子R语言的base包中函数如dataframe等默认因子在分类变量读入时就会生成，而tidyverse包中的readr等包则会保留数据读入时的原样不做改变，要生成因子则可以使用parse_factor函数进行处理。parse_factor函数更审慎一些，会对不在给定的因子水平中的变量取值...

发表了文章 • 2018-08-26 01:27 • 0 条评论

0

推荐

2009

阅读

tidyverse —— stringr包

stringr包，顾名思义，处理字符串专用包，本篇笔记对它进行简单介绍。提到字符串处理，有一个绕不过去的主题，它是字符串处理的利器，也是字符串处理的问题制造机，它就是——正则表达式。本篇笔记顺带介绍一下正则表达在R语言中的应用。1. 连接字符串在base包中，字符串的连接主要用paste和paste0两个函数，在...

发表了文章 • 2018-07-29 22:55 • 0 条评论

1

推荐

2085

阅读

tidyr包，tidyverse工具箱中的改锥和锤子，哪儿不顺眼修哪里，犀利得好比找茬儿的老板，专注把数据在长和宽的形态中互转，功能类似reshape2包，本篇顺带也回顾一下reshape2包。1. reshape2包1.1 melt函数以airquality数据为例，先把变量名全改成小写，方便之后的处理names(airquality) <- tolower(names(airquality))...

发表了文章 • 2018-07-23 00:26 • 0 条评论

2

推荐

1710

阅读

tidyverse —— readxl包

readxl包，读取Excel文件专用包，有和tidyverse核心包一样的特点，快！效率特高！话说Hadley大叔出品就没有效率低的，可能键盘是借来的，着急还。独立性高，不外部依赖Java啥的，xls和xlsx文件读取都可以。library(readxl)一个提醒，因为本包不是tidyverse的核心包，所以，不像readr包一样，library(tidyverse)后就可以...

发表了文章 • 2018-04-16 23:32 • 2 条评论

4

推荐

2496

阅读

tidyverse —— readr包

readr包用于读取数据。相比于base包，其优势在于速度快，能提速十余倍；相比于data.table包，其速度稍有逊色，作者Hadley大叔表示，差个1.2到2倍速度的样子，但是，在读取过程中能对数据进行更加精细的解析。下面介绍其主要函数。主要参考R for Data Science一书，http://r4ds.had.co.nz/data-import.html#getting-start...

发表了文章 • 2018-04-09 21:07 • 4 条评论

2

推荐

2397

阅读

tidyverse —— dplyr包

tidyverse包tidyverse是一个汇总包，一包更比6包强，用于数据清洗、转换、可视化等。tidyverse_packages() #列示tidyverse中所有的包其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个，本篇主要讲dplyr这一个。dplyr包主要操作函数dplyr包用于数据处理。整体而言，...

发表了文章 • 2018-04-02 20:31 • 0 条评论

tidyverse

tidyverse —— forcats包

tidyverse —— stringr包

tidyverse —— tidyr包

tidyverse —— readxl包

tidyverse —— readr包

tidyverse —— dplyr包