数据分析侠

上海南京数据分析联盟创始人,杭州创业谈TMT联合创始人,阿里支付宝资深数据分析,我爱数据分析网创始人,5年大数据行业数据分析和产品从业经验,长期从事和专注于国内大型互联网公司零售电商、金融保险等业务分析与决策支持,在数据存储、数据处理、数据可视化、商业智能、网站分析和数据挖掘方面均有丰富的项目经历。目前主要负责阿里数据产品研发和数据化运营以及市场第三方数据分析需求、数据平台搭建等。 经历:从南京到北京再到上海,再到杭州,一直在从事数据方面产品、算法、平台开发。

4
推荐
2586
阅读

数据分析系列篇(3):电商中数据分析应用

谈到零售,以淘宝、天猫、京东、Amazon为代表的电商公司,与大数据、数据分析保持着密不可分的关联。而他们的数据分析应用都有哪些呢?1.网站分析(流量分析)记得很久之前蓝鲸写过新手如何学习网站分析,现在也回顾下。Web分析人员应该具备的5个基本素质 1. 需要了解互联网。2. 你需要知道一些网页技术的基本概念。3....

发表了文章 • 2015-11-29 00:08 • 2 条评论

8
推荐
3785
阅读

数据分析系列篇(2):数据分析方法论

掌握了excel、spss、sas、r这些分析工具之后,我们来了解下数据分析的基本方法论,其实数据分析方法不复杂,我们需要把一些核心的分析方法掌握了活学活用。重点包括两块,一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等;一块...

发表了文章 • 2015-11-25 12:04 • 2 条评论

9
推荐
3713
阅读

数据分析系列篇(1):玩转excel

不知道现在怎么也变得这么鸡婆,连excel都要准备写一篇。没办法,还有很多不是做数据的小伙伴们不会excel啊,抱着不抛弃、不放弃的态度,就讲下excel如何玩转。其实excel不难,掌握几块就能轻松驾驭:1)函数 2)图表 3)数据处理写excel相关的书也不少,讲excel的讲解也很多,所以今天要写的不是也来个洋洋洒洒大而...

发表了文章 • 2015-11-24 10:36 • 4 条评论

6
推荐
4687
阅读

数据挖掘系列篇(2):会员分析

说到数据挖掘,就不得不说到会员分析。 上一篇: 数据挖掘系列篇(1):总结职业会员分析老生常谈的问题,包括会员分级、用户画像、会员个性化营销、会员价值挖掘等等。而现在围绕会员的运营模式也在发生着变化,从过去做产品,到现在做会员服务,从P到S的转变势必会需要介入数据来挖掘会员的特征、习惯、活跃、忠...

发表了文章 • 2015-11-20 12:59 • 5 条评论

5
推荐
3169
阅读

从BAT了解数据化运营体系

过去的运营体系弊端:过去运营的方式存在几个比较严重的问题:1)运营模式比较单一,很难适应互联网快速变化的节奏,不能及时根据市场和用户的变化作出调整。比如双十一、828、双12、黑色星期五等;2)摸不清自己的用户,不清楚自己产品的老用户是谁、什么习惯,也没有针对的运营来拉动新用户,导致最后很难挽留住用户。...

发表了文章 • 2015-11-19 18:54 • 3 条评论

6
推荐
3044
阅读

如何搭建数据化运营系统

导读随着互联网时代的发展,企业发现过去他们所做的粗狂式运营已经不能有效的提升效率和增加企业用户了,所以,一些企业开始找寻新的运营方式,比如逐渐转变为CPM(每千人成本)化的精细化经营,通过这样的运营来提升运营的效率,使企业广告投放效率尽可能的最大化。对企业而言,打造精细化运营的好处在于可以对目标用户群...

发表了文章 • 2015-11-17 10:07 • 2 条评论

0
推荐
3347
阅读

“KNN(K最邻近)算法”——数据分析、数据挖掘

KNN分类算法KNN(k-Nearest Neighbor algorithm )分类算法是最简单的机器学习算法之一,采用向量空间模型来分类,概念为相同类别的案例,彼此的相似度高,而可以借由计算与已知类别案例之相似度,来评估未知类别案例可能的分类。KNN根据某些样本实例与其他实例之间的相似性进行分类。特征相似的实例互相靠近,特征不相...

发表了文章 • 2015-11-07 20:00 • 0 条评论

1
推荐
2209
阅读

数据挖掘技术:客户价值分析(转)

使用RFM方法(最近购买日Recency, 各期购买频率Frequency, 各期平均单次购买金额Monetary)能够科学地预测老客户(有交易客户)今后的购买金额,再对销售毛利率、关系营销费用进行推算,就能按年、按季、按月分析出今后几期的客户价值。在这里,客户价值指CRM毛利。CRM毛利 = 购买金额 – 产品成本 – 关系营销费用。RFM...

发表了文章 • 2015-11-07 19:53 • 0 条评论

2
推荐
5941
阅读

“多变量分析”——数据挖掘、数据分析【初稿】

I。多重对应分析 多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。对应分析对数据的格式要求:对应分析数据的典型格式是列联表或交叉频数表。常表示不同...

发表了文章 • 2015-11-07 19:42 • 0 条评论

0
推荐
4042
阅读

假设检验——统计学基础知识点

什么是假设检验假设检验是用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。  生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值...

发表了文章 • 2015-11-07 19:13 • 0 条评论

5
推荐
3868
阅读

数据挖掘系列篇(1):总结职业

       今天下半年计划把数据分析、数据挖掘、机器学习这些东西都撸一把,很可能以后就没有时间再来撸了。希望各位也能互相监督,看看今年过年之前能不能把之前的一系列的都整理一遍。还有个消息就是计划11月底会把《数据分析侠A的成长故事》截稿了,出版社已经联系了,而且提了很多宝贵的建议,这...

发表了文章 • 2015-11-05 13:12 • 5 条评论

0
推荐
2178
阅读

Google Analytics 网址的构造

在Google Analytics里要区分百度的竞价广告和自然流量是有写困难的,Google URL Builder 可以根据自定义跟踪码来区分流量的来源 用户只要自己定义几个参数 URL Builder就能自己生成出新的跟踪代码,URL Builder参数基本有以下几个:广告系列来源(utm_source)要求。 使用 utm_source 来标识搜索引擎、简报名...

发表了文章 • 2015-11-01 22:34 • 0 条评论

0
推荐
1968
阅读

常见的数据科学家面试77个问题

下面是77个关于数据分析或者数据科学家招聘的时候会常会的几个问题,供各位同行参考。     1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的?3、什么是:提升值、关键绩效指标、强壮性、模型按合度、实验设...

发表了文章 • 2015-11-01 22:33 • 0 条评论

0
推荐
2403
阅读

市场研究的数据方法再回顾【第一章】——线性回归分析

一、线性回归方程的基本模型•线性回归方程从样本资料出发,一般利用最小二乘法,根据回归直线与样本数据点在垂直方向上的偏离程度最低的原则,进行回归方程的参数的求解。•线性回归分析是考察变量之间的数量关系变化规律,它通过一定的数学表达式---回归方程,来描述这种关系,以确定一个或几个变量的变化对另一个变量的...

发表了文章 • 2015-11-01 22:31 • 0 条评论

0
推荐
2038
阅读

市场研究的数据方法再回顾【第二章】——判别分析

一、判别分析法的基本思想      判别分析包括以下两步:    1、分析和解释各类指标之间存在的差异,并建立判别函数。    2、以第一步的分析结果为依据,将对那些未知分类属性的案例进行判别分类。二、判别分析基本模型与统计术语     (一)假设条件1、每一个类别都...

发表了文章 • 2015-11-01 22:20 • 0 条评论