浩彬老撕走在数据科学的路上

这里谈谈统计挖掘的一些事一些情,有理论,有算法,有实践,欢迎交流探讨!

3
推荐
2604
阅读

数据人也要懂的“装逼利器”,数据驱动下的“增长黑客”

作为一枚数据攻城狮,我们知道业务输入对于一个数据挖掘项目来说是多么的重要。但毕竟出身统计/IT,咱们讲起业务来可能总感觉少了那么一点韵味,因此今天,浩彬老撕给大家带来了一个具有数据思维的业务模型,Groth Hacking(增长黑客),单纯从名字就感受到铺面而来的逼格啊!(以上场景纯粹想象,攻城狮们请谨慎使用)1...

发表了文章 • 2016-06-26 21:17 • 4 条评论

5
推荐
3591
阅读

IBM SPSS Modeler最强工具书(6)——强大的数据操作功能(附数据及练习)

在前面,我们已经学会了读取数据,并且也介绍了一部分数据理解的内容。下一步,在CRISP-DM 流程的数据准备阶段,数据分析师可构建用于建模的最终数据集。在这里,可能涉及一系列的操作,包括创建新字段或改造现有字段,选择记录组或从更大的数据文件中采样,以及根据数据质量检查情况来清理数据。但是,正如CRISP-DM方法...

发表了文章 • 2016-06-19 21:04 • 4 条评论

5
推荐
4859
阅读

R语言,超级英雄云词图,你们要的自定义形状来了(附完整教程)

在上一期,浩彬老撕介绍了最新的R语言云词图包,wordcloud2,演示了如何用一行代码实现高大上的高考云词图。关于高考云词图的实现以及Wordcloud2的基本介绍,可以查看浩彬老撕的上一期文章:R语言,一行代码实现高大上的“高考文字云”(附完整教程)https://ask.hellobi.com/blog/wetalkdata/4092很多朋友表示很感兴趣,...

发表了文章 • 2016-06-11 21:35 • 2 条评论

2
推荐
5109
阅读

R语言,一行代码实现高大上的“高考文字云”(附完整教程)

一年一度的高考大日子又到了,在这里,浩彬老撕先预祝各位考生都能取得满意的成绩。每年的高考都会产生很多的爆点,引起很多的话题,今年也不例外,而且再创新高,诞生了高考界的第一网红:正好,R的文字云包“wordcloud2”也发布了,于是浩彬老撕也弄了一个高考文字云。你说要图案选择?咱有!支持中文,那是必须的!多少...

发表了文章 • 2016-06-09 16:40 • 12 条评论

2
推荐
3249
阅读

IBM SPSS Modeler最强工具书(5)一键生成数据探索报告

IBM SPSS Modeler最强工具书(5)——一键生成数据探索报告原创 2016-06-05 浩彬老撕 探数寻理因为要兼顾相关操作,因此关于数据探索和数据操作的内容会分多次介绍,但是在介绍完后,浩彬老撕会进行单独汇总整理,力求一个主题一个文档,这样大家就可以当成随身工具书了。本次介绍主要介绍通过类型节点定义...

发表了文章 • 2016-06-05 20:24 • 0 条评论

6
推荐
3699
阅读

统计分析/机器学习吐血整理最强指南

这是浩彬老撕自己的学习书单,希望能够帮助大家更好更快地理解数据科学,同时也希望继续完善自己。#关于这份学习清单#我会按照基础到入门给出详细推荐,并且附上个人点评。同时尽量做到各个资料在内容上并不重复(即使内容上有重复,也会在难度上做出区分),希望可以以最直接的方式告诉大家应该怎么选择。Ps:这是第一...

发表了文章 • 2016-05-27 11:56 • 4 条评论

7
推荐
2681
阅读

统计挖掘的一些事一些情(二)——回归分析

实际上,无论是日常的统计学习还是挖掘学习中,回归分析都可以算是大家最早接触,也是整个体系当中相当重要的一个内容了,所以咱们这期就从回归分析说起吧。一般来说,借助回归分析,我们希望可以量化描述预测变量与响应变量的关系,同时帮助我们进行预测。其他的例子还有:广告的投入与市场销售的关系,受教育程度与收...

发表了文章 • 2016-05-22 11:54 • 9 条评论

6
推荐
2582
阅读

统计挖掘的一些事一些情(一)——统计挖掘基本概念

这是这个公众号的第一个系列:统计挖掘的一些事一些情,在这个系列当中,我希望以尽可能“平易近人”的方式和大家讨论一下统计学的一些事一些情,希望大家能够以一种轻松的心态进到这门数据科学当中看一看。这里面会有一些典故,一些场景,一些案例;也会有一些公式,有一些算法,希望大家能够喜欢上这个系列!在这里首先...

发表了文章 • 2016-05-22 11:51 • 4 条评论

0
推荐
2565
阅读

IBM SPSS Modeler最强工具手册——数据读取的奥秘

谈到数据读取,大家估计想到本周浩彬老撕要开始介绍源节点了。可能你会说源节点不就是读取数据嘛,选择路径读取就好了,但是本期浩彬老撕还会告诉你,在读取数据后,不但有时候我们会遇到一些意想不到问题(例如数据和字段对应不上),而且我们需要做一定的设置(例如我们应该怎么在Modeler中设置它的角色和类型,这一点...

发表了文章 • 2016-05-22 11:46 • 1 条评论

1
推荐
3085
阅读

IBM SPSS Modeler最强工具手册——Modeler实用小技巧

上周结合了一个简单的例子为大家全面介绍Modeler的数据挖掘方法论,CRISP-DM,那么这周将为大家介绍在咱们日常利用SPSS Modeler进行数据分析时,如何借助一些小技巧提高分析效率。一一个数据流中往往包含有很多的节点,上图展示的就是一个流失分析数据挖掘项目当中的“数据处理流”,这时候我们可以看到大量的节点分...

发表了文章 • 2016-05-22 11:44 • 1 条评论

6
推荐
4650
阅读

IBM SPSS Modeler最强工具书手册——数据挖掘方法论体系

上周为大家介绍简单地系统介绍了IBMSPSS Modeler基本信息,包括发展历史,产品家族,数据挖掘方法导论,基本操作等,受到了大家的支持,浩彬老撕希望能把这个系列写成SPSS Modeler的超级工具手册,方便大家收藏,以后更好地使用Modeler。那么在本期,将结合一电信行业客户流失分析的例子,为大家全面介绍Modeler的数据挖...

发表了文章 • 2016-05-22 11:41 • 8 条评论

1
推荐
3717
阅读

SPSS Modeler最强工具手册-Modeler基本介绍

本周新开一个SPSS的工具系列,会结合算法和工具使用持续更新,欢迎广大SPSS使用爱好者共同交流!初步认识数据科学,这只是一个起点,远的真谈不上,也不合适。至于角度,为什么从spss谈起?说实话,咱们做项目也好或者只是学习一个技能,远大目标是要有,但是有一个切入点更为重要。所以这里,远大目标是数据科学,那切...

发表了文章 • 2016-05-22 11:31 • 2 条评论

1
推荐
2618
阅读

收购天气公司,IBM想做什么?(完整天气数据分析教程)

15年10月,IBM宣布20亿美金收购The Weather Company(天气公司)。当时这条信息引起了很多人的好奇,因为这与传统IT公司的收购截然不同,不是大数据也不是云计算,不是软件也不是硬件,那么这次收购究竟是为了什么?或者说,收购了The Weather Company经过半年之后,IBM做了什么?(图片来源IBM中国)这看似并...

发表了文章 • 2016-05-22 11:27 • 5 条评论

4
推荐
2114
阅读

数据科学的商业实践征程

在天善的第一天开张~第一篇就以最近参加的一次大数据微课分享就做起始,希望在这里多与大家相互交流~课程概要Guideline人人都说,我们正处于一个大数据时代,从IBM深蓝到谷歌AlphaGo,我们看到机器学习在这些科技公司手中非常的魅力。那么在具体的商业应用上,我们该如何利用数据科学?从最开始的商业问题界定,到数据处...

发表了文章 • 2016-05-22 11:22 • 5 条评论