数据分析人员在进行数据分析过程中往往会不知道从哪着手,不知道分析得对不对,不确定执行结果……那么我们就有必要学习掌握数据分析思维,提高分析能力。数据分析思维可以帮助分析人员理清分析思路,找准分析方向,从而提高分析的效率。
一、核心思维
1.结构化
结构化思维也可以看作金字塔思维,把待分析问题按不同方向去分类,然后不断拆分细化,能全方位的思考问题。
首先应该确定核心论点,一般是分析目的。例如视频中的例子销量下降就是核心论点。
其次是对核心论点进行结构拆解,拆解原则遵循MECE。MECE是金字塔原理的一个重要原则,意思为相互独立、完全穷尽,也就是说我们在对核心论点进行拆解时要做到不重叠、不遗漏的分类,这样则能做到考虑全面、周密。
最后再逐一的去验证这些分论点,用数据去量化论点,从而验证其可靠性。
注意:在实际情况中,一般是先把所有能想到的一些论点先写出来,然后在进行整理归纳成金字塔模型。
2.公式化
在结构化的基础上,这些论点往往会存在一些数量关系,使其能进行+、-、×、÷的计算,将这些论点进行量化分析,从而验证论点。公式化和结构化在分析过程中是相辅相成的,综合运用更有利于数据分析。例如:销售额=销量×客单价、利润=销售额-成本等。
一般的,不同类别的业务叠加常用加法,计算业务间的逻辑关系用减法,乘法和除法则是用来计算各种比率或比例的。例如下图中的获取用户的公式化思维
3.业务化
业务化即是深入了解业务情况,结合该项目的具体业务进行分析,并且能让分析结果进行落地执行。
用结构化思考+公式化拆解得出的最终分析论点再很多时候表示的是一种现象,不能体现产生结果的原因。所以需要继续去用业务思维去思考,站在业务人员或分析对象的角度思考问题,深究出现这种现象的原因。
4.小结
在分析过程中,这三种思维不是单独使用的,而是综合使用。一般的,先运用结构化思维理清分析方向该怎么分析,然后运用公式化思维把论点进行量化用数据验证可靠性,再是结合业务进行深究从而得出分析结果。
二、数据分析的思维技巧
1.象限法
象限法类似于数学中的坐标轴,选定分类条件根据分析对象的数据划分到不同的象限;优点是直观清晰,把数据进行人工划分后可以直接应用于策略;象限划分时可以依据中位数、平均数或者根据以往数据得出的经验值;常见的是四象限法和八象限法。
四象限法是二维的,例如时间管理理论把工作按照重要和紧急两个不同的程度进行了划分成四个象限。(图片来源于百度百科)
八象限法是立体的,也就是三维,例如RFM模型,把客户按最近一次消费(Recency)、消费频率(Frequency)、消费金额 (Monetary)三个维度分成八个象限。
2.多维法
多维分析是指对分析对象从多个维度去分析,这里一般是三个维度,每个维度有不同数据分类,这样代表总数据的大正方体就被分割成一个个小方块,落在同一个小方块的数据拥有同样的属性,这样可以通过对比小方块内的数据进行分析。如图,江浙沪地区2010年前三个季度三种商品的多维图:
常见的一些统计维度有:
用户统计维度:性别、年龄、地区……
用户行为维度:用户偏好、用户兴趣、用户流失……
消费维度:消费金额、消费频率、消费水平……
商品维度:商品品类、商品品牌、商品属性……
多维分析中,维度的分类如果选取不太合适就可能出现辛普森悖论这一情况。为了可以规避这一情况,可以使用钻取(最常用,即是把维度的分类进行细分,例如上图中的季度可以细分为月份)、切片、切块、旋转等技巧。多维法适用于数据齐全且量大的分析。
3.假设法
在一些情况下,如进入新市场的销量、商品提价后销量的变化情况,可能没有明细数据进行分析,那么就需要用到假设法。假设法也就是假设一个变量或者比率成立,然后根据部分数据进行反推,这是一种启发思维的技巧,一般过程是先假设后验证然后判断出分析结果。
例题:你是自营电商分析师,现在想将商品提价,你分析下销售额会有怎样的变化?
解答思路:首先可以确定销量会下降,那么下降多少?
这里就要假设商品流量情况,提价后转化率的变化情况,然后根据历史数据汇总出销量下降百分百,从而得出销售额的变化情况。
4.指数法
指数法是把某个数据多个指标按一定的计算转化为同度量的一个值,这个度量值称为指数。例如在一场游戏竞技比赛中要确定该场的MVP,则是需要根据击杀数、死亡数、助攻数、经济、补兵等指标进行综合计算出一个得分,得分高的为MVP。
指数法常用的有线性加权、反比例、log三种。线性加权即是把每个指标乘以一个系数后相加,反比例即是用数学上的反比例函数y=k/x变化后在计算,log即是数学中所说的对数一般以2为底数或者10为底数。指数法使用没有统一标准,一般是根据经验来做,将无法利用的数据加工成可以可利用的。例如,NBA计算最有价值球员的指数参考:
5.二八法
二八法即是二八法则也可以叫做帕累托法则,比如在个人财富上可以说世界上20%的人掌握80%的财富。而在数据分析中,则可以理解为20%的数据产生了80%的效果需要围绕这20%的数据进行挖掘。往往在使用二八法则的时候和排名有关系,排在前20%的才算是有效数据。
二八法是抓重点分析,适用于任何行业。找到重点,发现其特征,然后可以思考如何让其余的80%向这20%转化,提高效果。
6.对比法
对比法就是用两组或两组以上的数据进行比较,常见的是用于在时间维度上的同比和环比、与竞争对手的对比、类别之间的对比、特征和属性对比等。
对比法可以发现数据变化规律,使用非常频繁,多与前面的技巧结合使用。
7.漏斗法
漏斗法即是漏斗图,有点像倒金字塔,是一个流程化思考方式,常用于像新用户的开发、购物转化率这些有变化和一定流程的分析中。不过,单一的漏斗分析是没有用的,不能得出什么结果,要与其它相结合,如与历史数据的对比等。