BAO胖子 这些简单但有效的分析方法,你玩过吗?

浏览: 3374

引言

BAO胖子

16年商业智能领域经验,目前就职于某世界500IT企业任高级系统架构师。对整个商业智能生命周期有精深的理解和丰富的实战经验,擅长数据分析,数据仓库架构等方面的工作。天善热门课程《高质量数据仓库建模指南》的特约讲师。

前言

笔者参加过大大小小的BI(BusinessIntelligence)项目大概有几十个,发现一个非常有趣的现象,BI系统的使用者呈两极分化。一类占至少95%以上的用户,使用非常基础的分析报表,内容无非包括基础数据、增长量、增长率、占比等简单的分析指标。另一类占最多5%比例的用户,一旦提及分析言必称正态分布、决策树、机器学习、神经元网络等高贵冷艳的词汇,奈何曲高和寡。报表分布比例亦是如此,基础的信息查询占绝大比例,为上述的95%用户所使用,上述5%的用户的分析需求则让普通使用者望而却步。在报表的需求上简直冰火两重天,要么过于简单,要么过于高深。

其实有很多简单并容易理解的分析方法并没有被广泛的推广和使用,这也是笔者本篇文章的用意所在,使普通用户通过简单的学习即可掌握一些非常有效的分析手段。

第一章、开胃小菜

本期,同期,增长率,占比,几乎是张报表就都是这些数据项目。人们似乎已经习惯了看到这些数据项目,的确是这样,对比/增长率是非常直观的让人发现问题的办法,此类对比分析衍生出来同期比,上期比,计划比,累积同期比等等花样翻新的比较模式。由此,对于大多数用户而言,此类分析简单直接,不用特别学习就能理解其含义。

那么这里我先介绍一道开胃小菜,在增长率等计算指标之上增加一个新的计算项目:贡献率,让我们来看看它所具有的含义。

Clipboard Image.png


       上表是2015年全国前十省份GDP情况表,通过增长率,我们可以看到各个省份和全年同期比较的增长情况,但如果希望看到各个省份对全国GDP增长的影响,就需要另外的指标。而相比占比,贡献率是更直观的看到单个省份对全国GDP影响的指标。的计算公式是(本省当年GDP – 本省上年GDP)/ 上年全国GDP。以广东为例,2015年比2014年增长了7.1%,全国比上年增长了6.3%, 其中广东帮助全国向上拉动了百分之0.8。

    贡献率只是一道开胃小菜,它是非常容易理解而又好用的指标,而当然我们还可以更进一步的用更丰富的方法去做分析。比如说,变动因素分析法。


第二章、变动因素分析法

我们在做分析的时候,很多很多时候都是要抽丝剥茧般的去找到发生某种现象的根本原因,而变动因素分析法是一种非常简单,易于理解的办法。

我们来看看下面的例子:

Clipboard Image.png

           如上是某品牌的一张产品分类销售情况的统计报表,从中我们可以看到,总体销售情况本季度比上季度增长了37.7%,按照贡献率的分析,我们也能知道ABC类产品对整体的贡献程度。那么,销售收入的增长变化由最基本的两种因素构成,一种因素是本季度比上季度卖的量更多了,因此带来收入的增长;还有一种因素是本季度比上季度卖的价格更贵了,从而带来收入的增长,那么,到底是因为价格的原因和销量的原因分别带来多少收入呢?我们通过图形的对比来更深入的了解这两种不同因素带来的变化。如图2-2所示,我们以某一个产品分类为例, 其中P1表示上个季度该产品分类的平均价格, Q1表示上个季度该产品分类的销售数量, P2表示本季度价格, Q2表示本季度销售数量, 而销售金额很显然就是Pn*Qn,而两个季度的销售金额变化就是P2*Q2 – P1*Q1, 可用如下的面积图来表示。我们分为两个场景I和II, 这两个场景的销售金额变化是相等的,但其根本原因却有很大的不同。场景I中,两个季度的平均价格差异不大,主要是靠销量的增长带来整体收入的增长; 而场景II中,恰恰相反,两个季度的销售量差异不大,但平均价格的提升带来了整体收入的增长。而这些重要的信息,是从图2-1报表中无法反应出来的,

Clipboard Image.png


            本季度比上季度的收入增长的计算公式为: P2 * Q2 – P1 * Q1, 我们把公式变换一下, P2 * Q2 – P1 * Q1 = P2 * Q2 – P2 * Q1 + P2 * Q1 – P1 * Q1 = (Q2 –Q1) * P2 + Q1 * (P2 – P1)

           如图2-3所示,A1 = (Q2 – Q1) *P1,即由于销量变化带来的收入的变化。A2 = Q1 * (P2 – P1), 即由于价格变化带来的收入变化。

Clipboard Image.png


这种分析方法称为变动因素分析法,根据两个因子的变化去分别计算它们对整体的影响,这样有助于我们对数据进行拆解,从而做更深入的分析。

那么我们按照这种方法对产品分类ABC进行计算,将得到如下图2-4的结果,建议大家在学习过后亲自尝试一下变动因素分析法的使用。

Clipboard Image.png


第三章、平均单价分析法

          在上一节,我们反复提到的平均单价,在电力的电力销售领域早已被广泛的使用,类似的,在产品组合分析中,它也是重要的分析方法。平均单价也是衡量一个品牌或者一个产品套系重要货币表现,比如小米手机系列的平均单价较低,而苹果手机系列的平均单价很高,而当市场趋于稳定时,提高产品的平均单价是非常常见的营销战略方式。

          平均单价是衡量产品套系高中低价位销售比例的重要指标,此外,平均单价又和成本,税金结合分析,对于产品的benchmark制定等重要运营举措均有非常重要的意义。有关平均单价的内容很多,这里我只是介绍其中一种较为常见的分析方式,为大家打开这扇大门,你会发现其实和贡献率,变动因素分析法一样,它非常容易理解以及方便使用,对于普通用户来说,不需要学习高端的统计学理论,即刻即可轻松掌握。

          一个产品套系的平均单价的变化由两方面决定,一方面是单纯价格的升高或者降低,比如促销降价,另一方面是同一产品套系中高中低价位产品的销售比例发生变化,比如高价位的产品卖的多了,自然平均单价就升高。

那么这两种变化对收入的影响的计算公式如下:

对于单品而言:

             产品结构变化对收入的影响 = (本期分类销售比例 - 基期分类销售比例)* (基期分类单价 - 基期总平均单价)* 基期总销量

             产品结构变化对总平均单价的影响 = 产品结构变化对收入的影响 / 本期总销量

            产品单价变化对收入的影响 = (本期分类销售单价 - 基期分类销售单价)* 本期销量

            产品单价变化对总平均单价的影响 = 产品单价变化对收入的影响 / 本期总销量

 

对于总计而言:收入和单价均是对应分类指标的合计。

我们来看一个例子,仍然沿用上面的产品分类ABC为例。

Clipboard Image.png

由图3-1可知,本期该品牌总平均单价比上期提高了11.67元,其中由于涨价等原因向上拉动了14元,由于B类产品和C类产品销售比例的变化向下拉动了-2.33元。当你的产品分类很多时,这张统计表会让你清晰的分辨出哪些产品对你的平均单价拉动作用大,从而指导你对产品的销售情况进行有效的评估,并做出正确的决策。

第四章、十分法分析

相信很多人都知道80/20法则,最初这个是有一个意大利人叫帕累托发现的,80%的意大利的财富集中在20%的人手里。因此也被称为帕累托法则。80/20法则认为,原因和结果,投入和产出,努力和报酬之间本来就存在着难以解释的不平衡,一般来说,投入和努力可以分为两种不同的类型:

1.      多数,他们只能造成少许的影响

2.      少数,他们造成主要的重大的影响

后来这种不平衡理论被不断的演化,比如20%的用户贡献80%的收入,比如一个软件的20%的功能被80%的人使用,等等。而十分法分析(Decile Analysis)就是一种利用80/20法则的分析手段。

这里我们给出的分析例子是对客户对利润的贡献做十分法分析,办法很简单:

1.      将所有客户的本来利润计算出来,降序排列

2.      把客户十等分,比如我们有4450个客户,就把前445个客户作为第一分组,接下来的445个客户作为第二分组,以此类推

3.      计算每个分组中,客户所带来的利润之和,则得到如下的表格和图形

Clipboard Image.png

Clipboard Image.png

由图4-1和图4-2,我们可以看到前20%的客户,贡献了77%的利润,而后20%的客户只贡献了1.5%的利润,这样在实际的工作中,就可以根据客户消费特质的不同,进行有针对性的营销和服务。

而通过十分法,可以给客户的消费水平或者带来利润的能力打可量化的标签,作为客户的重要维度属性进行进一步的分析,比如按照不同客户的等级分析他们的消费RFM的差异,从而制定营销策略。

此外,还可以通过如下的等级迁移表(Decile Migration),来观测各个等级客户的留存流失情况。

比如下图1/1对应的20%,则表示2014年处于第1分组的客户,到2016年还有20%仍处于第1分组,而1/LOST对应的30%则表示,2014第1分组已经有30%的客户流失。

Clipboard Image.png

第五章、小结

如上,我介绍了四种分析方法,这些方法相比那些高贵冷艳的机器学习,决策树,神经元网络更简单,更容易为人学习、理解以及应用,而商业智能存在的最大意义就是让恰当的信息在恰当的时间恰当的地点交付到恰当的人手上从而做出恰当的决策,也就是说组织中的每个人都有查看其权限范围内信息的权利,而让使用者掌握更多分析的技能,是把商业智能得以广泛开展的基础。数据分析之路,征途漫漫,解锁更多方法,释放数据更大价值。除以上的方法,还有四象限分析法,浓度分析等多种分析方法,大家如果有兴趣可以进一步学习。


推荐 5
本文由 天善智能 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

5 个评论

一直关注BAO胖子的博客和视频的。
参团学习了,感谢BAO胖子的分享
Raymond,有个地方是不是写错了如下:
原来是:
如图2-3所示,A1 = (Q2 – Q1) *P1,即由于销量变化带来的收入的变化。A2 = Q1 * (P2 – P1), 即由于价格变化带来的收入变化
应该是:
如图2-3所示,A1 = (Q2 – Q1) *P2,即由于销量变化带来的收入的变化。A2 = Q1 * (P2 – P1), 即由于价格变化带来的收入变化
哦,是的,谢谢!
@,谁能帮我改一下?

Raymond,有个地方是不是写错了如下:
原来是:
如图2-3所示,A1 = (Q2 – Q1) *P1,即由于销量变化带来的收入的变化。A2 = Q1 * (P2 – P1), 即由于价格变化带来的收入变化
应该是:
如图2-3所示,A1 = (Q2 – Q1) *P2,即由于销量变化带来的收入的变化。A2 = Q1 * (P2 – P1), 即由于价格变化带来的收入变化

要回复文章请先登录注册