谢佳标的博客专栏

精通R语言、Rattle、SpssClementine、SAS等多种数据挖掘工具。

0
推荐
2718
阅读

R语言:利用caret包中的dummyVars函数进行虚拟变量处理

dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterization----建立一套完整的虚拟变量先举一个简单的例子:survey<-data.frame(service=c("very unhappy","unhappy","neutral","happy","very happy"))survey##        service## 1 very unhap...

发表了文章 • 2016-07-04 16:03 • 0 条评论

0
推荐
1542
阅读

用R语言将数据转换成Format Vowpal Wabbit Input Files

# 从网上下载titanicDF的数据源titanicDF<-read.csv('http://math.ucdenver.edu/RTutorial/titanic.txt',sep='\t')#  将数据源存到本地# write.table(titanicDF,'titanicDF.txt',row.names=F)# write.csv(titanicDF,"titanicDF.csv",row.names=F)# 创建新变量 titletitanicDF$Title<-ifelse(grepl('Mr ',tita...

发表了文章 • 2016-07-04 16:03 • 0 条评论

0
推荐
2402
阅读

R语言:利用相关性分析对复杂数据进行数据探索

cor(1:5,1:5)## [1] 1cor(1:5,5:1)## [1] -1cor(1:5,c(1,2,3,4,4))## [1] 0.9701cor(1:5,c(1,2,3,1,4))## [1] 0.6063library(RCurl)## Loading required package: bitopsurlfile<-"http://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data"x<-getURL(urlfile,ssl.verifypeer=FALSE)adults<...

发表了文章 • 2016-07-04 15:59 • 0 条评论

0
推荐
1834
阅读

展示如何用R处理稀疏矩阵和利用GLMNET包

展示如何用R处理稀疏矩阵和利用GLMNET包# 建立简单的some_data.framesome_dataframe<-read.table("~\some_data.frame.txt",sep="\t",header=T)some_dataframe##    c1 c2 c3 c4 c5 c6 c7 c8 c9 c10 outcome## 1   2  7  0  0  0  0  0  0  0   0  ...

发表了文章 • 2016-07-04 15:58 • 0 条评论

0
推荐
2149
阅读

R语言:多元线性回归和模型检验

利用swiss数据集进行多元线性回归研究# 先查看各变量间的散点图  pairs(swiss, panel = panel.smooth, main = "swiss data",      col = 3 + (swiss$Catholic > 50))# 利用全部变量建立多元线性回归a=lm(Fertility ~ . , data = swiss)summary(a)## ## Call:## lm(formula = Fertility ~ ., da...

发表了文章 • 2016-07-04 15:55 • 2 条评论

0
推荐
2822
阅读

R语言:SMOTE - Supersampling Rare Events in R:用R对非平衡数据的处理方法

SMOTE - Supersampling Rare Events in R:用R对稀有事件进行超级采样在这个例子中将用到以下三个包{DMwR} - Functions and data for the book “Data Mining with R” and SMOTE algorithm:SMOTE算法{caret} - modeling wrapper, functions, commands:模型封装、函数、命令{pROC} - Area Under the Curve (AUC) functions...

发表了文章 • 2016-07-04 15:52 • 0 条评论

0
推荐
4577
阅读

R语言建立回归分析,并利用VIF查看共线性问题的例子

使用R对内置longley数据集进行回归分析,如果以GNP.deflator作为因变量y,问这个数据集是否存在多重共线性问题?应该选择哪些变量参与回归?答:## 查看longley的数据结构str(longley)## 'data.frame':    16 obs. of  7 variables:##  $ GNP.deflator: num  83 88.5 88.2 89.5...

发表了文章 • 2016-07-04 15:50 • 0 条评论

19
推荐
7965
阅读

R语言快速入门免费视频课程 课件及数据文件下载

课程前言介绍课程大纲:本课程详细介绍了R语言、一个友好的R编辑器RStudido以及R语言数据挖掘可视化工具Rattle的安装及使用;通过通俗易懂的案例给大家演示了R语言的数据对象(向量、矩阵和数据框)。介绍了如何如何把外部的csv、txt以及xlsx等格式的电子表格数据导入到R中,并如何通过read.csv函数爬取网上数据。最后介...

发表了文章 • 2016-07-04 11:37 • 18 条评论