前言
如何成功地处理、分析、和理解数据。
- 获取数据(从各种数据源将数据导入程序中)
- 整理数据(编码缺失值、修复或删除错误数据、将变量转换为更为方便的格式)
- 注释数据(以记住每段数据的含义)
- 总结数据(通过描述性统计量了解数据的概况)
- 数据可视化(一图胜千言)
- 数据建模(解释数据间的关系,检验假设)
- 整理结果(创建具有出版水平的表格与图形)
第一部分 入门(前5章)
第1章 R语言介绍
主要内容:R的安装;熟悉R语言;运行R程序
1。1为什么选择使用R?
开源;免费;跨平台;可以完成几乎所有的数据分析工作;可进行交互的数据分析和探索。
1。2R的获取与安装
1。3R的使用
R是一种区分大小写的解释型的语言。
(1)在>后每次输入一条命令;
(2)或一次性执行写脚本文本中的一组命令。
R中多数功能由 程序内置函数 和用户自编函数 提供。
R语句由函数与赋值构成,R使 <- 作为赋值符号。
如:
x<-rnorm(5)
创建了一个x的向量对象,包含了5个来自标准正态分布的随机偏差。
注释以 # 开头,会被R解释器忽略。
1。3。1新手上路
1。3。2 获取帮助
help.start() 打开帮助文档
1。3。3 工作空间
workspace是R的工作环境,储存着所有用户定义的对象(向量,矩阵,函数,数据框,列表)
函数q()将结束会话允许你退出R。
1。3。4 输入与输出
1。输入
source("myscript.R")
2。文本输出
sink()
3.图形输出
dev.off()
1。4包
通过可选模块的下载和安装来实现,目前有2500多个包(package)
1。4。1什么是包
包是R函数,数据,预编译代码以一种定义完善的格式组成的集合。计算机上存储包的目录称为库(library)。
函数libPaths()能够显示库所在的位置
函数library()则可以显示库中有哪些包
1。4。2包的安装
install.package()
1。4。3包的载入
library()
1。4。4包的使用方法
help(package="package_name")
R语言中编程的常见错误
- 使用了错误的大小写
- 早使用函数调用时忘记加括号
- 忘记使用引号
- R将\视为转义字符
1。5批处理1。6将输出用为输入-------结果的重用
1。7处理大数据集
考虑到(1)数据集的大小(2)要应用的统计方法