数据挖掘学习之感悟:以点带线,以线带面

浏览: 2523

    快节奏的生活,越来越缺乏耐心,越发焦虑。焦虑代表潜意识里积极的进取心。但焦虑不代表努力,如果调试好,焦虑的下一步是努力。努力工作努力学习!工作或学习的方法不对,会再次产生焦虑。

    焦虑的原因就是外界的快(项目需求快,成长速度快......),“眼睛一睁一闭一天就过去了吭”。自我成长的途径之一就是学习+思考。学什么?学思路,学方法,学技术。总结就是以点带线,以线带面。

QQ截图20180511100720.jpg

点就是案例,通过对案例的剖析,获得解题思路的构建,使我们的逻辑思维更加严密。线就是构建模型,通过RPython的模型实现,达到工具包,模型库的熟练应用,获得技术的提升,同时亲自感受R语言及python的各自优势。更重要的是可以将业务逻辑与模型实现无缝连接。继续探究,那就是以线带面,面就是原理与算法,知其然知其所以然。通晓算法原理如同打通任督二脉。无论是案例还是模型实现,对应的原理算法都是万变不离其宗,比如梯度下降算法在逻辑回归中有出现,在决策树中也有出现。同时神经网络的激活函数会包含逻辑回归......。另外在学习过程中,要融会贯通,随着知识点的增加,点与点之间的距离就会缩短,慢慢就会连接起来,形成一个数据挖掘与业务分析交织起来的知识网。这个网就是长在你的身体里。

 那么该怎么实现呢?这个问题问的好!发现好货喽!

左手Python右手R,多算法对比,经典数据挖掘机器学习实战!

以下是R语言的逻辑回归实现的代码及算法原理的部分讲解截图。

 #导入数据集
loudian<-read.csv(file="D:/R案例/逻辑回归/logist_model.csv")
#查看数据集前六行
head(loudian)
#查看数据集描述
summary(loudian)
str(loudian)
loudian$是否窃漏电=as.factor(loudian$是否窃漏电)
str(loudian)
#建立逻辑回归模型
logist_1=glm(是否窃漏电~电量趋势增长指标+线损指标+告警类指标,family=binomial(link='logit'),data=loudian)
#逻辑回归模型描述
summary(logist_1)
##查看回归系数
coef(logist_1)
##回归系数指数化
exp(coef(logist_1))
logist_1
#输出预测之后的结果,type=response,表示输出结果预测响应变量为1的概率。
pre=predict(logist_1,type='response')
class<-pre>0.5
class
print(logist_1)
#对分类和预测结果进行统计分析计数(混淆矩阵)
tb<-table(loudian$是否窃漏电,pre > 0.5)
tb
#分类准确率--稍后作对比
(sum(diag(tb))/sum(tb))
#绘制ROC曲线,寻找最优临界点
install.packages("pROC")
library(pROC)
modelroc=roc(loudian$是否窃漏电,pre)
plot(modelroc,print.auc=TRUE,auc.polygon=TRUE,grid=c(0.1,0.2),
grid.col=c("green","red"),max.auc.polygon=TRUE,auc.polygon.col="blue",print.thres=TRUE)
#将预测的结果与数据合并,并验证
loudian_pre<- data.frame(是否窃漏电=loudian$是否窃漏电,predict =ifelse(pre>0.167,'1','0'))

table(loudian_pre$是否窃漏电,loudian_pre$predict)
#讨论
loudian_auc<-table(loudian_pre$是否窃漏电,loudian_pre$pre)
loudian_auc
(sum(diag(loudian_auc))/sum(loudian_auc))
loudian_0.5<-table(loudian$是否窃漏电,pre > 0.5)
loudian_0.5
(sum(diag(loudian_0.5))/sum(loudian_0.5))

save(loudian, file = "D:/R案例/逻辑回归/logist_model.Rdata")

Clipboard Image.png

推荐 3
本文由 结实 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

1 个评论

内容可以长点,文章,最好带上代码

要回复文章请先登录注册