未来之窗

谢谢你的浏览,如有疑问欢迎勾搭!

0
推荐
1750
阅读

plyr 包系列文章之一(a*ply)

plyr包是解决一系列常见数据分析统计问题的一组工具,需要拆分一个大数据变成均匀的片,然后对每一小片应用函数,最后把所有的结果结合在一起。了解plyr包已经有一年多的时间了,使用当中确实被它的强大功能所折服,所以才想起写文章,不仅为了学习更多的plyr包的函数,同时也在温故而知新,如果大家想学习这方面的知识...

发表了文章 • 2017-09-23 16:15 • 0 条评论

3
推荐
2939
阅读

一起学聚类分析

介绍              聚类意思就是把一个大数据集按照某种距离计算方式,分成若干个分类。其中每个分类类内的差异性比类与类之间的差异性小很多,差不多和古语“物以类聚,人以群分”有几分相似吧。                      ...

发表了文章 • 2017-09-16 22:06 • 1 条评论

4
推荐
4128
阅读

利用算法识别糖尿病患者(R语言实现)

本文章是基于R语言一个数据挖掘的案例实现(预测糖尿病),主要内容包括: 数据源介绍——缺失值分析及填补——数据集拆分——建立模型及优化——总结希望内容对大家有所收获,如有疑问欢迎沟通数据源介绍本次数据挖掘的数据来自于印第安人糖尿病数据库,数据源名称PimaIndiansDiabetes2,可以通过以下途径进行获取 # 获取...

发表了文章 • 2017-09-10 09:56 • 2 条评论