tidyverse —— readxl包

发表: 2018-04-16 浏览: 1714

R语言

readxl包，读取Excel文件专用包，有和tidyverse核心包一样的特点，快！效率特高！

话说Hadley大叔出品就没有效率低的，可能键盘是借来的，着急还。

独立性高，不外部依赖Java啥的，xls和xlsx文件读取都可以。

library(readxl)

一个提醒，因为本包不是tidyverse的核心包，所以，不像readr包一样，library(tidyverse)后就可以直接使用，还是要单独载入的。

现在进入正题了，有这么一个文件mydata.xlsx，内有两个表单，数据有缺失，各行的列数不一，要读取其中第二个表单的数据。

Clipboard Image.png

excel_sheets('mydata.xlsx')

#[1] "Sheet1" "Sheet2"

这函数用来列示文件中的表单名，之后就可以针对表单进行读取数据。

f <- read_excel('mydata.xlsx', sheet = "Sheet2", col_names = F)

view(f)

Clipboard Image.png

col_names表示是否以第一行作为变量名，可以给出一个向量自定义列名。sheet如果不声明的话，就默认读取第一张表单。read_excel自行截取最小的能够囊括所有观测值的矩阵范围进行读取，所以不用太担心各行变量列数不同而没有读取完整数据。

如果想要读取选定的范围的数据，则可以在range里声明。比如只读取第一张表单中的前三行前四列的数据：

(f <- read_excel('mydata.xlsx', sheet = "Sheet2", col_names = F,

                  range = 'A1:D3'))

Clipboard Image.png

2 个评论

有没有R for Data Science的中文版呢，英文版读起来太不容易了。

我没有。来吧老铁，一起干大事，边看边翻译，造福后人

要回复文章请先登录或注册