一、 简单探索
iris
dim(iris) #数据集的维度/大小
names(iris) #数据集中变量的名称
names(iris)<-c(1,2,3,4,5)
str(iris) #数据集的结构
help(str)
attributes(iris) #数据集的属性
iris[,]
iris[1:4,] #查看iris的(所有列)前5行
iris[,1:3] #查看iris的(所有行)前5列
iris[1,]
iris[,1]
iris[2,1]
head(iris) #返回iris的前6行
head(iris,20) #返回iris的前1行
tail(iris) #返回iris的最后6行
tail(iris,3) #返回iris的最后三行
二、R语言基础绘图
散点图
1.普通散点图
# 普通散点图
par(mfrow=c(1,2))
# 绘制一维数据
plot(x=rnorm(10))
# 绘制二维数据
plot(women)
par(mfrow=c(1,1))
2.散点图矩阵
# 利用 plot 函数
plot(iris[,1:4],main="利用 plot 函数绘制散点图矩阵")
# 利用 pairs 函数
pairs(iris[,1:4],main="利用 pairs 函数绘制散点图矩阵")
柱状图和条形图
(配图彩虹色rainbow)
par(mfrow=c(1,2))
for(i in c(FALSE,TRUE)){
+ barplot(VADeaths,horiz = i,beside = T,col = rainbow(5))
}
par(mfrow=c(1,1))
饼图
(较简陋)
pie(table(mtcars$cyl))
Q-Q 图
library(ggplot2)
qqnorm(economics$psavert)
茎叶图
stem(mtcars$wt)
点图
dotchart(mtcars$mpg,labels = rownames(mtcars))
三、 R语言描述性统计分析
平均数:mean 函数
w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,
+ 66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)
(w.mean<-mean(w))
中位数:median 函数
x <- c(75, 64, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5)
median(x)
百分位数:quantile 函数
w <- c(75.0, 64.0, 47.4, 66.9, 62.2, 62.2, 58.7, 63.5,
+ 66.6, 64.0, 57.0, 69.0, 56.9, 50.0, 72.0)
quantile(w)
描述性统计函数:summary 函数
vars<-c("mpg","hp","wt") # 关注焦点是每加仑汽油行驶英里数(mpg)、马力(hp)和车重(wt)
head(mtcars[vars])
summary(mtcars[vars])
summary(iris[,5]) #对因子变量进行频数统计
描述性统计分析:Hmisc 包中 describe 函数
(比summary函数多出更多内容)
library(Hmisc)
describe(mtcars[vars])