人人都爱数据分析 Data analysis six fly(3)

浏览: 2913

image.png

第3章 数据分析常识

在前面几章里讲了很多关于数据分析市场和数据分析师的职业生涯发展,下面的几篇会重点介绍数据分析的理论知识、数据分析的方法论、数据分析的分析流程、数据分析报告如何撰写、电商中的数据分析应用等具体的应用案例。经常也会被问到作为一个不是统计学背景的学生,能否入行数据分析的问题。还有包括像平时的具体数据分析工作都有哪些?作为数据分析入门菜鸟怎么才能打好数据分析方面的基础,需要看哪些方面的书等等。其实这些问题对于一个刚毕业的或者没有太多数据行业经验的人来说,是很正常的一个情况。包括自己在内,如果要重新跨行去进入一个新领域也会遇到这些问题。首先咨询相关行业的内部师兄师姐,看看相应的介绍和材料,如果能够有比较系统的书籍介绍那是最好不过的了。当然自己也需要花时间去归纳和总结,再结合大量的实践案例长期以往基本上会对这块新领域能够了然于胸了。

前段时间和做大数据培训的创始人聊到,我问他原来是做什么的,让我诧异的是他原来是做用户体验(User Experience Design,UED)出身的。对我来说,第一反应认为产品提需求,UED根据PD的相应需求文档构思设计相应的产品,而对于数据分析以及业务运营,这的确就是很多UED所欠缺的核心,而脱离实际业务的UED并不是真正的UED,没有结合产品和用户需求本身来设计,很多也只是空中楼阁。我和那位创始人聊了很久,特别是他在过去的一些经历和感受,同时他也是阿里巴巴曾经做过UED的同事,我想这个经验分享在互联网公司还是比较有代表性的。

说到用户体验,很多人会感觉这是一个很虚的概念,是一种纯主观的在用户使用一个产品(服务)的过程中建立起来的心理感受。因为它是纯主观的,就带有一定的不确定因素。我接着问道,那平时调查用户体验时你们会关注数据吗?令我欣慰的是,那位创始人说平时太需要数据的支持了。包括之前设计的功能布局、页面结构、按钮的颜色、整体的风格都需要通过大量的AB 测试来验证用户的体验是否符合预期。这在互联网公司尤为典型,像现在上线的产品和功能很多都是拍脑袋决定或者固有的思维模式认为就应该这样,而实际情况没并就一定是用户希望看到的。特别是典型的Facebook从早期的一个简单的社交产品到现在日活跃用户十亿,一个很小的改变就可能会引来用户的强烈感觉。在这些多年里,Facebook尝试了各种方案,像newspaper、clipboard等样式,虽然这些都实现了,但是都因为数据的原因没有上线。

我那位大数据培训的朋友也分享了一下他们亲身经历的故事,是关于当时做超市购物车的案例。购物车是每个网上超市都有的,可以让用户挑选商品,快速结账,所以功能上一点都不能少,而且文案要给用户都能看明白。而在具体设计到购物车的布局时产生了分歧:一种是希望以纵向列表的方式展示,另一种是以大图的方式。但是大家都没有尝试过这种大图的模式,而纵向列表的方式是用户使用最方便的,比较一目了然。另外,对于购物车的单位设计也存在一些争议,很多电商网站都是用“件”来表示一个商品,比如同一件商品买了两个到底是算一件还是两件,大家对此一直争论不休。通过那几年的UED工作,他对UED有了更深的理解,虽然对于UED有很多想法,但是由于各种原因,比如上线时间老板说了算,还有很多想法受限技术的原因很难实现,特别是在实现方案上没有用户研究的数据支撑很难判断而导致最终都没有实现。我听了他的诉苦也是感触很深,跨部门之间的沟通的确需要很大的成本,特别是没有站在对方的利益场上就更难合作。所以如果大家都能有一种共同的价值观和意向,在沟通协调上能够达到事半功倍的效果。

3.1 常见的数据分析问题

如果你希望从事这个数据分析行业的,亦或是对数据分析感兴趣的,那就需要把数据分析常见的一些问题弄明白,避免被别人忽悠到不知东南西北。即使作为在数据分析行业从事了几年的职场老鸟来说,再次回顾常见的数据分析问题也会有不一样的思考和感受。

在我们接触到数据分析这个领域的时候,不同的对象、不同的时期会遇到不同的问题。对于刚入行的同学来说可能需要知道数据分析的基本概念,数据分析都有哪些,包括数据分析和统计分析、数据挖掘的区别和联系是什么,在数据分析上常见的工具都有哪些,还需要了解如何增加自己在数据分析这块的经验和技术,在面试的过程中如何给自己加分等。对于入行1、2年的数据新人来说,需要在有一些基本的数据处理和分析能力基础上思考如何自我成长,在现有的环境下突破瓶颈。对于工作了很长时间的资深数据分析人员来说,则需要考虑如何能够在技能上和个人发展上再次升华。这些都是在数据分析生涯中会遇到的问题。而本小节会重点介绍我们作为入门的数据分析新人遇到的一些常识问题,这些都是我们在数据分析讨论、论坛以及在面试环节可能会聊到的话题。

1. 数据分析是什么?数据分析包含哪些?

数据也称观测值,是实验、测量、观察、调查等的结果,常以数量的形式给出。数据分析的目的是把隐没在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来,以找出所研究对象的内在规律。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。数据分析是组织有目的地收集数据、分析数据,使之成为信息的过程。这一过程是质量管理体系的支持过程。在产品的整个寿命周期,包括从市场调研到售后服务和最终处置的各个过程都需要适当运用数据分析过程,以提升有效性。例如J.开普勒通过分析行星角位置的观测数据,找出了行星运动规律。又如,一个企业的领导人要通过市场调查,分析所得数据以判定市场动向,从而制定合适的生产及销售计划。因此数据分析有极广泛的应用范围。

而数据分析包括的内容从需求识别、获取数据、整理数据、观察数据到分析数据、数据展现的各个环节。

第一步就是要准确识别需求,定位到问题的核心所在和需要哪些数据来支撑你的观点,这样为收集数据、分析数据提供清楚的目标。区分一个高级数据分析师和一般数据分析师,能够第一眼就识别问题的所在,掌握数据库的熟练程度,第一时间通过数据的校验验证自己的观点。

第二步获取数据,将需求转变成具体的数据要求,明确哪些数据是需要的,他们在什么地方,可以通过谁来获取。

第三步就是观察数据,通过加工、整理分析成有用的信息,通常结合时间序列、对比、趋势等。

第四步分析数据,结合现有的业务和数据发现的问题,提出建议和意见。

最后往往还要再回过头看看数据分析方法是否正确、是否数据质量上还有什么问题、收集到的数据是否真实等。

2. 数据分析与数据挖掘的区别?

在接触数据分析和数据挖掘的时候,也会遇到数据分析和数据挖掘是什么,之间区别有哪些。从实际工作中来看数据分析和数据挖掘也是两件不同的事情,但是两者有很强的相关联性。

从概念上讲,数据分析是在统计数据的基础上通过结合分析方法论得出一定的结论,而数据挖掘更多是对历史数据进行未知结果的探索。像我们最常见的“啤酒与尿布”的故事,我们结合数据只能分析出啤酒和尿布的销量都很高,但是这其中为什么啤酒和尿布是有相关联的,那就需要通过数据挖掘的方法来挖掘,从中发现去买尿布的男士都会顺便去买啤酒。再比如我们通过数据分析发现电商购物的人群70%都是女性,所以结论就是女性更喜欢购物,而通过数据挖掘我们发现由于女性天生喜欢逛街购物、大部分时间会去关注比较漂亮的商品、没有太多目的性,导致女性在电商中的购物比例很高。

在工作内容上,数据分析的工作偏重对业务层面的理解,能够结合具体的业务和已有的数据,给出自己有力的观点,给到业务决策的支持。数据挖掘的工作偏重系统工程,通过历史数据样本召回、数据特征工程和模型算法,对未来结果预测。所以在工作内容上两者的差别也是比较巨大,但又有联系。举个例子,在公司做数据分析师的阶段,日常的工作是整理网站流量趋势变化的报表,如果流量上涨或者下跌要能够分析这其中的原因是什么,可能是业务方有营销活动的动作,也有可能是系统层面的数据问题。而在公司做数据挖掘的平时工作就在某一个小点上,如果利用数据挖掘来预测明天可能有哪些用户会来登陆。涉及登陆频次、用户的个人属性情况、用户使用网站的周期、网站的活动因素等各方面的数据特征。利用模型去训练和预测明天登陆用户的概念。最后在实际的业务场景中去应用。

因而不难发现,数据分析更多是对已有数据进行观察分析,数据挖掘更多是对知识的规律探索总结。在方法论上数据分析更多凭借人结合数据经验,数据挖掘会结合算法模型分析。

3. 数据分析和做报表的区别?

过去BI一直被人认为就是做报表的,所以不管是业务部门还是技术部门一有报表需求就会去找BI部门。而BI部门也不想把自己定位成做报表的部门,所以一直在接这方面的需求没有太多积极性。

咨询行业内有一个经典的故事:

一个农民赶着羊群在草原上走,迎面碰到一个人对他说:“我可以告诉你,你的羊群有几只羊。”随即,他用卫星定位技术和网络技术将信息发到总部的数据库……片刻后,他告诉农民羊群共有1460只羊,并且要求农民给他一只羊作为报酬,农民答应了。随后,农民对他讲:“如果我能说出你是干嘛的,你能否把羊还给我?”那人说,“行”。农民说:“你是一个咨询顾问。”那人很惊讶,问农民是怎么知道的。农民说:“有三个理由足以让我知道:1.我没有请你,你自己就找上门来;2.你告诉了我一个早已知道的东西,还要向我收费;3.一看就知道你不懂我们这一行,你抱的根本不是羊,而是一只牧羊犬。”

这个笑话在咨询界广为流传,并有不同的公司版本,和前段时间“友谊的小船说翻就翻”一样在微博和朋友圈被人转发。而有意思的是,许多资深咨询顾问看到这个笑话并不感到恼怒,而是会心地一笑。公开场合下,他们一定会非常自信地说,咨询非常深刻地影响企业的战略,因此具有非常重要的价值。不过私底下,他们对于是否真的“能改变世界”这一点并不够自信。作为定位于公司辅助决策的数据分析部门而言,BI也在接受这样的调整。名称叫商业智能,指导公司的高层,而在具体的实际行动中,因为高层不懂数据或者数据部门不理解业务,再或者没有足够的数据能够支撑你去做很多的分析,导致最终的很多公司数据部门变成了一个“做报表”的部门。而报表作为管理层经常需要看的媒介,又不可或缺。值得高兴的是,现在有很多可视化的数据工具来帮助传统企业在做报表的过程中提高效率和优化美观,与过去需要数据分析师专门每天去重复拉取excel报表来说明显进步很多。但对于一些更加深入的分析还是需要资深的数据分析师来结合业务单独分析,并非是简单的报表的能够解决的情况。所以资深的数据分析师还是一种是众多公司争抢的资源。

如今在市场方面,数据分析、数据仓库、数据挖掘、大数据等概念热得发烫,数据分析师被认为是万众仰慕的职场新宠,关于数据分析师技能、职责、职业素质、发展前景等的讨论不绝于耳。就像“姚黑”一样,数据分析的质疑声也不断传出和放大,数据分析、挖掘到底能否产生价值,多大价值?

数据分析员、数据分析师不应当只会“数羊”!不应当只是发现本应该发现的“经验”!而应当掌握数据探索,发现潜在的价值,预见可能将发生的某种“坏的未来”!

4. 数据分析难不难学?特别是背景非理工科的。

只要有恒心就会学会,而且这个目前也是一个热门,因为现在数据量越来越大了,所以对这方面的需求也越来越多。学习数据分析,先要打好理论基础,《概率论与数理统计》、《统计学》、《深入浅出数据分析》等。然后就是主流的数据分析软件,关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,Stata,R,Python,SAS等。

如果是理工科背景的,了解数据分析并掌握相对来说比较好上手。重点是对统计学知识的熟练掌握,另外就是在编程方面能够有一定的基础,在处理数据和查询数据、分析上面能够自己操作,特别推荐像R、python这样比较好上手的语言,基本能够解决目前80%的数据分析需求。

如果是非理工科的,那可能还是需要在高等数据、微积分这些上面先花段时间学习一下,了解数学方面的基本方法论。学习常用的数据分析方法论都有哪些,比如趋势分析、对比分析、关联分析、预测分析等。常用的市场分析方法论,如SWOT、PEST、4P、波士顿矩阵、5W2H等。

最后还是需要大量的项目和工作案例来锻炼,学会怎样操作那些数据分析软件,学习从哪些角度去思考分析常见的指标问题。然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。

5. 数据分析可以有哪些应用?

随着互联网、电信、金融等行业的数据爆发式的增长,对海量数据的分析和处理的需求也非常多,重点集中在电商领域的人群偏好和客户画像、社交领域的关系模型分析、内容搜索排序、金融的反作弊反欺诈、保险定价分析、用户账户安全登录、个人征信数据分析等都是很典型的应用案例。

在电商领域像最早接触的网站分析,其中包括流量分析,每天的流量的PV/UV的监控,用户路径流量的入口出口,用户特征分布情况,交易数据的记录详情,会员交叉销售和推荐等。后面就陆续开始做用户的画像研究,包括用户的基本属性、购买能力、行为特征、社交网络、心理特征、兴趣爱好,像有些比如有没有生孩子、有没有结婚、具体职业都需要做模型分析预测。再后来就是接入具体商品库和营销平台,尝试做各种各样的个性化营销和商品推荐。

在社交领域结合好友之间的个人属性相似度、互动程度、内容排序做用户间的社交平台,社交网络中充斥着用户的潜在需求、热点资讯信息、用户关系,这里面大量的信息对于企业来说具有巨大的价值,如果掌握了这些数据之后加上分析,无论对于现有产品的改进还是对未来产品的走势都有十分帮助,像我们在实际模型中应用到的社区圈子的识别、人物影响力的计算、社交网络上的信息传播、僵尸账号和垃圾信息的识别、基于社交对热点内容的舆情监控分析等。

在金融反作弊领域同样数据分析扮演着重要的作用,识别账号的交易是否符合正常的范围,有没有存在虚假交易、刷单等行为。

保险定价中像车险,可以根据车主平时的行车路线、里程、行车习惯、出险记录、职业、年龄、性别等给出不同的定价,比如你开一个紧凑型车的两个人,在平时的驾驶习惯上一个比较急躁,那这个人出险的概率就是另一个人的几倍,那么如果两个人的车险定价是一样的很明显不合理,对于前者来说对保险的损失更大,而后者是相对来说比较优质的客户。

6. 厉害的数据分析都是什么样?

就像刚刚介绍到的数羊的故事,如果年轻人走入羊群进行考察,并用各种统计方法和不同工具进行了全面的判断,然后,他告诉农民羊群共有1460只羊,仅有10只公羊、其余为母羊,可以繁殖的母羊有1000只,其余为羊仔,根据一些特征,羊群可以分为“肯吃型”、“疯跑型”、“活蹦乱跳小仔型”三类。农民听后既惊讶又失望,惊讶的是一个没放过羊的人和他一样了解羊群,失望的是他所听到的都是他早已知道的。

而如果回答是“羊群共有1460只羊,仅有10只公羊、其余为母羊,可以繁殖的母羊有1000只,其余为羊仔。因此,当务之急是卖掉长肥的小羊,马上引进更多的种公羊,以解决当前种羊和母羊比例严重失调的问题;根据对市场的预估,5月份每卖掉一只小羊将比4月份多赚150元,因此,我们必须把握先机,4月前育肥,5月清栏;对于“疯跑型”羊,有必要采取两条腿绑绳的方法限制其大范围跑动,对于“活蹦乱跳小羊”应采取与成年羊隔离的放养的方式。”

厉害的数据分析师就是在大量数据集中发现有用关系的系统性的方法,在开始之前,你不必知道寻找的是什么,你可以通过拟合不同模型和研究不同关系来探索数据,直到你发现有用的信息为止。通过数据分析的方式来帮助业务快速的成长。

能力:一定要懂点战略、才能结合商业;一定要漂亮的presentation、才能buying;一定要有global view、才能打单;一定要懂业务、才能结合市场;一定要专几种工具、才能干活;一定要学好、才能有效率;一定要有强悍理论基础、才能入门;一定要努力、才能赚钱;最重要的:一定要务实、才有reputation;不懂的话以后慢慢就明白了。

目标:1-做过多少个项目?2-业务背景有哪些,是否跨行业?3-做过多少种类型的模型?做了多少个模型?4-基于模型做过多少次完整的marketing闭环?

7. 数据分析方面有哪些好书值得推荐的?

这个我在知乎上也发表过,像《深入浅出数据分析》、《R语言实战》、《数据之美》、《数据之魅》、《大数据时代》、《集体智慧编程》、《从0到1》、《失控》等都是比较热门且实用的。

具体的书单可以参考:

——小白篇——

1.大数据时代

2.浪潮之巅

3.互联网创业密码

4.从0到1

5.决战大数据

6.块数据

7.大数据预测:告诉你谁会点击、购买、死去或撒谎

8.信号和噪声

9.数据之巅

10.跨界:开启互联网与传统行业融合新趋势

11.删除:大数据取舍之道

12.互联网思维:工作、生活、商业的大革新

——入门篇——

1.数据化管理:洞悉零售及电子商务运营

2.转化:提升网站流量和转化率的技巧

3.社交网站的数据挖掘与分析

4.数据分析 :企业的贤内助

5.淘宝大数据

6.网站数据分析:数据驱动的网站管理.优化和运营

7.人人都是网站分析师:从分析师的视角理解网站和解读数据

8.大数据营销:定位客户

9.数据挖掘与数据化运营实战 :思路.方法.技巧与应用

10.大数据分析:决胜互联网金融时代

11.分析的力量

12.网站数据挖掘与分析:系统方法与商业实践

——菜鸟篇——

1.谁说菜鸟不会数据分析(工具篇+入门篇)

2.EXCEL图表之道/如何制作专业有效的商务图表

3.决策分析:以Excel为分析工具

4.Word/Excel/PPT
2013商务办公从新手到高手

5.实用数据分析

6.深入浅出数据分析

7.构建高效数据分析模板:职场必学的Excel函数与动态图表高级

8.SAS统计分析与应用从入门到精通(第2版)

9.IBM
SPSS数据分析与挖掘实战案例精粹

10.从零进阶!数据分析的统计基础

11.Excel
2010函数与公式

12.Excel高效办公.数据处理与分析

——高手篇——

1.集体智慧编程

2.利用Python进行数据分析

3.数据挖掘与R语言

4.R语言与数据挖掘最佳实践和经典案例

5.R的极客理想工具篇

6.数据挖掘 :实用案例分析

7.R与Hadoop大数据分析实战

8.深入理解大数据:大数据处理与编程实践

9.数据挖掘:实用机器学习工具与技术

10.R语言与网站分析

11.Mahout算法解析与案例实战

12.算法心得:高效算法的奥秘

——大神篇——

1.大数据管理:数据集成的技术、方法与最佳实践

2.HADOOP技术内幕系列

3.MYSQL技术内幕

4.Storm
实时数据处理

5.Spark快速数据处理

6.Oracle数据库性能优化的艺术

7.Oracle达人修炼秘籍:Oracle 11g数据库管理与开发指南

8.Hadoop应用开发技术详解

8. 数据科学家具备哪些特质?

如果从广义的角度讲,从事数据处理、加工、分析等工作的数据科学家、数据架构师和数据工程师都可以笼统地称为数据科学家;而从狭义的角度讲,那些具有数据分析能力,精通各类算法,直接处理数据的人员才可以称为数据科学家。

最后引用 Thomas
H. Davenport(埃森哲战略变革研究院主任) 和 D.J. Patil(美国科学促进会科学与技术政策研究员,为美国国防部服务)的话来总结数据科学家需要具备的能力:

数据科学家倾向于用探索数据的方式来看待周围的世界。(好奇心)

把大量散乱的数据变成结构化的可供分析的数据,还要找出丰富的数据源,整合其他可能不完整的数据源,并清理成结果数据集。(问题分体整理能力)

新的竞争环境中,挑战不断地变化,新数据不断地流入,数据科学家需要帮助决策者穿梭于各种分析,从临时数据分析到持续的数据交互分析。(快速学习能力)

数据科学家会遇到技术瓶颈,但他们能够找到新颖的解决方案。(问题转化能力)

当他们有所发现,便交流他们的发现,建议新的业务方向。(业务精通)

他们很有创造力的展示视觉化的信息,也让找到的模式清晰而有说服力。(表现沟通能力)

他们会把蕴含在数据中的规律建议给 Boss,从而影响产品,流程和决策。(决策力)

9. 作为创业公司怎么去做数据分析?

对于创业公司来说也想利用数据来解决实际中的业务问题,可是又没有像BAT那样的成熟技术,怎么才能做好数据分析的工作呢?

首先就是要解决数据源的问题,一方面自己要积累用户的信息,另一方面像app或者网站的log日志都需要有人清洗沉淀。同时也可以借助第三方数据平台,积攒数据的同时学习别人的经验,根据自己的需求为用户和产品贴标签。

没有强大的数据库可以租用服务器,建立自己对应的数据分析框架。例如日报表月报表这些都OUT了,应该明确适合公司的格式,如果需要这些定制需求的报表,目前流行的大数据的解决方案大部分都是以Hadoop为基础架构。什么是Hadoop?简单来说Hadoop是一个分布式计算的解决方案,分布式通俗来说就是把一件事分布到几台计算机上运行。由多台计算机同时运行和存储数据,比一台计算机运行速度快,而且如果数据量大了,或者报表复杂导致运算速度慢,只要再加计算机就解决了。

当每台计算机运算完毕后,会把中间结果集中到一台计算机上,再把这些中间结果汇总起来得出最终结果。把手头的数据进行预处理,包括将不同数据库的数据导入到一个数据库中,数据的粗选,分析,分类,会用到EMC 的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存储Infobright等,而一些批处理,或者基于半结构化数据的需求可以使用Hadoop。先别头大,如果你不是淘宝京东这样的巨头没有那么大数据量可以不这么麻烦,剔除那些和其他数据差别很大的就行。

最后就是搭建自己的一套数据运营管理体系,从管理层到业务层都需要关注的数据指标、统一口径、数据分析报表、数据结合应用等。

10. 数据分析师怎么去培养商业感觉?

商业无外乎两点,一是业务模式,二是用户。对于业务模式来说,你需要明白其中的整个流程,包括盈利模式是什么,运营手段有哪些,有什么风险和防范点。特别是像我们当时做电子商务,从线下到线上的运作流程是什么样子,都需要哪些部门的协调合作,中间可能会发生什么问题,平时的广告投放都是哪些渠道,搜索引擎关键词的效果和硬广的投放效果哪个好,运营活动哪些是做的好、以及为什么做的好的原因是什么。

第二点就是去理解用户,懂人性。像百度现在做的捆绑营销被很多人吐槽,而微信的清爽界面很受大家的点赞,伴随着这样的用户体验导致微信的日活可以做到5亿多。你要明白用户关注的是什么,他们需要的是什么,而不是给用户一堆东西让他自己去做选择。不尊重用户的后果就是用户也离你而去。还有就是像9158、YY视频这些女主播,做的模式也非常好,就是抓住了屌丝的心理。

常见的数据分析问题明白之后,会有效地指导你在后续的数据分析入门。

3.2 数据分析思路

在面对数据分析的问题时,我们该如何去思考从哪些方面去着手。记得2011年的时候在北京看到某个医院写着“望闻问切”四个字的时候,当时想这个和我们平时做的数据分析工作正是差不多。而作为经常用到的5W2H、4P等等分析方法论其实也是这样的道理。比如我们在做一款游戏产品的时候,会去用户都是谁、他们有什么需求、希望得到什么、怎么满足他们的需求等,产品上就需要把这样的需求转变成实际的产品,给玩家提供很多可玩的场景,设置很多装备和道具,针对不同的玩家可以选择不同的职业,在节假日做大量的促销活动刺激玩家购买相应的道具等。这些产品上的实现也都需要相应的数据上的支撑。

中医上讲的“望闻问切”,是扁鹊在总结前人的经验基础上总结出来的,这四种诊法现在影响着中医古今。其中“望” 就是观察病人的神、色、形、态的变化。“神”是精神、神气状态;“色”是五脏气血的外在荣枯色泽的表现;“形”是形体丰实虚弱的征象;“态”是动态的灵活呆滞的表现。扁鹊很重视也很善于望诊,把它列为四诊之首。 所谓“闻诊”,是指听病人说话的声音、呼吸、咳嗽、呕吐、呃逆、嗳气等的声动,还要以鼻闻病人的体味、口臭、痰涕、大小般发出的气味。 所谓“问诊”,就是问病人起病和转变的情形,寒热、汗、头身感、大小便、饮食、胸腹、耳、口等各种状况。扁鹊在总结前人诊法的基础上,又发明创造了“切诊法”。所谓“切诊”,就是脉诊和触诊。脉诊就是切脉,掌握脉象。触诊,就是以手触按病人的体表病颁部分,察看病人的体温、硬软、拒按或喜按等,以助诊断。

而数据分析师也和医生,在遇到一个问题时,怎么去“望闻问切”?

1. 望

观察数据:当你在看一个数据的时候,观察它前后、历史是否异常。第一反应更多是基于分析师自己的经验判断,如果是一名资深的数据分析师可能会一眼就看出相关数据的问题,定位到问题原因所在。如果经验不是很丰富,并不要紧,重点是捋清楚数据来源、数据组成、业务思路等,再去一个一个点的分析。

观察数据的过程记住4个要点:1.明确分析的基本方向;2.整理需要的指标;3.关键指标的对比分析;4.对于有意义的结论总结。

明确分析的基本方向是观察数据前的第一步,比如你的网站上线的流量现状是什么样子?如果是结合你的流量推广效果分析,可以先明确当前的流量现状和未来的流量走势预估,中间需要做哪些内容运营和用户运营可以采取的方案。

2. 闻

并不是所有的问题都是那么容易发现,一眼就能看出来,有些是隐藏的很深。“闻”就是你能通过一些工具发现出不正常的地方,通过一些手段来佐证你的判断。再拿网站流量的案例,如果你的流量今天突然掉下来,而明天又好了,那多半的原因是因为有营销活动的影响,而非技术上的问题。而如果持续一周了网站流量都在不断下跌的情况,那就要查查技术上的问题了。像我们之前就是遇到移动端上的流量监控问题,观察了一周发现流量一直在下跌,而我们又没做什么特殊的改动,再去查埋点问题问技术,发现产品上已经由native页面改成H5页面的形式,埋点也发生了变化,这也直接导致最新的H5的流量根本没有统计进去。

3. 问

有很多细节问题因人而异、因行业不同、业务不同都会有很大的差别,那就需要主动的询问。特别是在大公司,复杂的组织架构导致很多部门、员工可能之间都不熟悉,不能保证有效及时的沟通,也有很多信息可能没有同步到。一方面需要经常和运营、技术等部门保持信息的通畅,另一方面可以建立有效的沟通机制,比如定期的周报、月报同步等。

一般在确定分析问题的过程中,沟通是最费事费力的。对方不在公司,不方便接电话,和你的KPI不一致等各种原因都可能导致你们的沟通无法继续。在与人沟通这方面要多学会先听明白别人的意思,再提出自己的观点和想法。尽量和对方保持平等友好的沟通方式,冲突和吵架都不利于问题的解决。

4. 切

根据发现的问题,具体的诊断,给出合理的建议。在确定问题的时候,不是光靠猜来判断,而是具体的逻辑分析。如果看过大量的英剧那种悬疑剧就会明白,如果一个侦探要怀疑某人的时候,都需要有足够的证据来帮助你证明你的观点,而之前看过几部国产电视剧,这类题材一直没有热播的原因,很大程度都是主角都没有细节的分析就可以得出判断的结论,这让观众在思维推理上无法信服。

如果你是一名公司的数据分析师,判断的准确率是你的权威性的重要影响因素。想想如果你经常判断一个问题判断原因错误,那作为接受你分析的听众从他自己内心深处也会逐渐丧失对你的信任。所以我们可以少出结论,但不能给错误的结论。想想如果是一名医生判断错误了病情,给错了药方,那可能就是一条人命。

3.3 常用的数据分析方法

常用的数据分析方法重点包括两块。一块是统计分析方法论:描述统计、假设检验、相关分析、方差分析、回归分析、聚类分析、判别分析、主成分与因子分析、时间序列分析、决策树等;一块是营销管理常用分析方法论:SWOT、4P、PEST、SMART、5W2H、User behavior等。

3.3.1 统计分析方法论

1.描述统计(Descriptive statistics):描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。目的是描述数据特征,找出数据的基本规律。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

(1)数据的频数分析:在数据的预处理部分,我们曾经提到利用频数分析和交叉频数分析来检验异常值。此外,频数分析也可以发现一些统计规律。比如说,收入低的被调查者用户满意度比收入高的被调查者高,或者女性的用户满意度比男性低等。不过这些规律只是表面的特征,在后面的分析中还要经过检验。

(2)数据的集中趋势分析:数据的集中趋势分析是用来反映数据的一般水平,常用的指标有平均值、中位数和众数等。各指标的具体意义如下:

平均值:是衡量数据的中心位置的重要指标,反映了一些数据必然性的特点,包括算术平均值、加权算术平均值、调和平均值和几何平均值。

中位数:是另外一种反映数据的中心位置的指标,其确定方法是将所有数据以由小到大的顺序排列,位于中央的数据值就是中位数。

众数:是指在数据中发生频率最高的数据值。

如果各个数据之间的差异程度较小,用平均值就有较好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况,用中位数或众数有较好的代表性。

(3)数据的离散程度分析:数据的离散程度分析主要是用来反映数据之间的差异程度,常用的指标有方差和标准差。方差是标准差的平方,根据不同的数据类型有不同的计算方法。

(4)数据的分布:在统计分析中,通常要假设样本的分布属于正态分布,数据的正态性离群值检验,已知标准差Nair检验,未知标准差时,有Grubbs检验,Dixon检验,偏度-峰度法等。其中常用偏度-峰度法需要用偏度和峰度两个指标来检查样本是否符合正态分布。偏度衡量的是样本分布的偏斜方向和程度;而峰度衡量的是样本分布曲线的尖峰程度。一般情况下,如果样本的偏度接近于0,而峰度接近于3,就可以判断总体的分布接近于正态分布。

(5)绘制统计图:用图形的形式来表达数据,比用文字表达更清晰、更简明。在SPSS软件里,可以很容易的绘制各个变量的统计图形,包括条形图、饼图和折线图等。

2.假设检验:是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u—检验法、t检验法、χ2检验法(卡方检验)、F—检验法,秩和检验等。

3.相关分析:相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。常见的有线性相关分析、偏相关分析和距离分析。相关分析与回归分析在实际应用中有密切关系。然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式。而在相关分析中 ,所讨论的变量的地位一样,分析侧重于随机变量之间的种种相关特征。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

4.方差分析(Analysis of Variance,简称ANOVA):又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。 由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。

方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。

5.回归分析:回归主要的种类有:线性回归,曲线回归,二元logistic回归,多元logistic回归。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。

一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。

6.聚类分析:聚类主要解决的是在“物以类聚、人以群分”,比如以收入分群,高富帅VS矮丑穷;比如按职场分群,职场精英VS职场小白等等。

聚类的方法层出不穷,基于用户间彼此距离的长短来对用户进行聚类划分的方法依然是当前最流行的方法。大致的思路是这样的:首先确定选择哪些指标对用户进行聚类;然后在选择的指标上计算用户彼此间的距离,距离的计算公式很多,最常用的就是直线距离(把选择的指标当作维度、用户在每个指标下都有相应的取值,可以看作多维空间中的一个点,用户彼此间的距离就可理解为两者之间的直线距离。);最后聚类方法把彼此距离比较短的用户聚为一类,类与类之间的距离相对比较长。

常用的算法k-means、分层、FCM等。

7.判别分析:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。

常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。

注意事项:

a. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;

b. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);

c. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。

相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。

应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。

8.主成分与因子分析:主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。

因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,将变量表示成为各因子的线性组合,从而把一些具有错综复杂关系的变量归结为少数几个综合因子。(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)。

9.时间序列分析:经典的统计分析都假定数据序列具有独立性,而时间序列分析则侧重研究数据序列的互相依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,记录了某地区第一个月,第二个月,……,第N个月的降雨量,利用时间序列分析方法,可以对未来各月的雨量进行预报。

10.决策树(Decision Tree):是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

常见的数据分析方法论大体的就是这些,结合案例多练习下基本上就明白是什么回事。

3.3.2 营销管理方法论

1.SWOT:所谓SWOT分析,即基于内外部竞争环境和竞争条件下的态势分析,就是将与研究对象密切相关的各种主要内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后用系统分析的思想,把各种因素相互匹配起来加以分析,从中得出一系列相应的结论,而结论通常带有一定的决策性。

运用这种方法,可以对研究对象所处的情景进行全面、系统、准确的研究,从而根据研究结果制定相应的发展战略、计划以及对策等。

S (strength)是优势、W (weakness)是劣势,O (opportunity)是机会、T (threat)是威胁。按照企业竞争战略的完整概念,战略应是一个企业“能够做的”(即组织的强项和弱项)和“可能做的”(即环境的机会和威胁)之间的有机组合。

2.4P:在市场营销组合观念中,4p是指:产品(product) 价格(price) 渠道(place) 促销(promotion),4p理论是营销策略的基础。

⑴产品:产品性能如何?产品有哪些特点?产品的外观与包装如何?产品的服务与保证如何?

⑵价格:企业的合理利润以及顾客可以接受的价格是否得到考虑?定价是否符合公司的竞争策略?

⑶促销:企业如何通过广告、公关、营业推广和人员推销等手段将产品信息传递给消费者以促成消费行为的达成?

⑷分销:产品通过什么渠道销售?如何将产品顺利送抵消费者的手中。

3.PEST:PEST分析是指宏观环境的分析,P是政治(politics),E是经济(economy),S是社会(society),T是技术(technology)。在分析一个企业集团所处的背景的时候,通常是通过这四个因素来进行分析企业集团所面临的状况。

4.SMART:SMART原则指的是,具体的(specific)、可衡量的(measurable)、可以达到的(attainable)、相关的(relevant)、日期(time-bound)。

基本的数据分析方法论包括这些。

3.4 趋势分析

平时我们接触到最多的就是对历史数据的回顾,对未来趋势的预测。特别是在互联网金融中应用很多,比如余额宝的转入转出的几分钟到账,本质上并不是余额宝从货币基金几分钟转账到你的账户,而是从中间资金池近实时转入转出。而这个中间的资金池每天都存入转出多少资金,就需要根据历史经验的数据进行趋势预测分析。在我们常见的数据分析方法论中,趋势分析是很重要的一个分析方法论。比如在做销售的预测、财务的预测、流量的预测等。趋势预测法又称趋势分析法。是指自变量为时间,因变量为时间的函数的模式。具体又包括:趋势平均法、指数平滑法、直线趋势法、非直线趋势法。

趋势预测法的主要优点是考虑时间序列发展趋势,使预测结果能更好地符合实际。根据对准确程度要求不同, 可选择一次或二次移动平均值来进行预测。首先是分别移动计算相邻数期的平均值,其次确定变动趋势和趋势平均值,最后以最近期的平均值加趋势平均值与距离预测时间的期数的乘积,即得预测值。

值得注意得是,趋势移动平均法中的第一次移动平均与简单移动平均法不同, 同样是第 t 期的移动平均值,趋势移动平均法是求第 t 期实际值到第 t-n+1 期之和的平均值,而简单移动平均法是求第 t-1 项实际值到第 t-n 期之和的平均值。 在实际运用过程中,千万不能混淆。

比如趋势预测如果在企业中的应用有,对同一企业的两个或两个以上连续年度财务报表中的某些项目,或者相关财务比率进行比较分析,判断企业发展趋势的研究方法,具体包括5个方面。

(1)销售趋势

销售是企业最基本的经营活动之一,销售是否活跃从一个侧面反映了企业的经营能力。企业的销售量随市场情况的变化而变化,不同行业中企业的销售特点各不相同,分析人员要充分了解有关客户所在行业的特点,才能做出正确的分疥。企业自身的销售趋势可以说明企业的经营状况,通过企业之间销售趋势的比较,分析人员可以获得更多的有用信息。在销售趋势出现异常的情况下,要仔细判断形成这种趋势的原因。此外,销售额的增加不一定与销售数量直接相关,要考虑市场价格的影响。

(2)收益趋势

销售收入为企业提供了收入和现金的来源,企业获得的最终收益要从销售收入中扣除成本和费用。收益趋势是信用分析的另一个重要因素,要关注销售利润串的变化,对收益趋势要做企业间和行业间的数据比较。收益趋势与销售趋势具有可比性,在正常情况下,如果原材料和人工费用稳定,企业的盈利将与销售额同步增长,但在原材料和人工成本快速增加或者各项费用的增加超出销售额同步增长的时候,销售额的增长并不意味着利润的增加,如果销售量的增加是由于大幅度降价换来的,企业也会损失大量的利润,所以要将销售趋势和收益趋势结合分析。

(3)净资产变动趋势

企业净资产是总资产减去总负债后的余额,代表企业所有者拥有的资产,也代表企业清算后最终能剩下的价值,所以债权人和授信人十分关注这一指标以及该指标变动的原因和影响。造成净资产变动的原因一般有以下几个方面:留存收益:股本变化;资产重估增值;债务减少等。分析人员要仔细分析净资产变动的原因,确定是否只是表面上的净资产变动,再分析其实质。无论是股本变化引起的净资产增加,还是资产重估以及债务减少引起的净资产增加,都只是表面上的净资产增加,往往会掩盖实际亏损的情况,只有留存收益增加或发行股份引起的净资产增加对企业才是有利的。

(4)营运资本变动趋势

营运资本是流动资产减去流动负债的结果,营运资本与客户按时履行还款义务的能力有很大关系。营运资本的多少,一胶能反映企业短期偿债能力的强弱,因而其变化趋势应引起关注。营运资本可以满足企业短期融资的需要,其稳步增长是企业经营良性循环的主要特征之一,营运资本的需要量与企业不同时期的业务量有很大的关系。随着业务量的变化,资产的流动性和质量会有很大的变化,尤其是应收账款和存货的质量,在分析营运资本的趋势时要仔细核查。

(5)财务比率的变动趋势

分新人员通过对财务比串变动趋势的分轿能获得很多的信息,一些比较重要的比率趋势以及分析方法有:流动比率和速动比率应保持稳定或稳步上升的趋势;存货周转串应保持平稳,在有较大变动时应调查其原因;应收账款周转天数应保持下降的趋势:营运资本周转串的大幅度提高可能表示要增加营运资本,而营运资本周转率的大幅度下降可能说明企业的流动性受到了严重影响;固定资产与净资产比率的大幅度增长或稳定增长,可能表示固定资产投资超出了企业的需要或者融资能力;总负债与净资产比率应保持一个比较低的水平,这样债权人才能得到更多的保障;销售利润率和净资产利润串的趋势很重要,它们与企业的发展宣接相关。

3.5 对比分析

除了趋势分析之外,对比分析是我们另外一种很重要的分析思路。对比分析法也称比较分析法,是把客观事物加以比较,以达到认识事物的本质和规律并做出正确评价的目的。

对比分析法通常是把两个相互联系的指标数据进行比较,从数量上展示和说明研究对象规模的大小,水平的高低,速度的快慢,以及各种关系是否协调。在对比分析中,选择合适的对比标准是十分关键的步骤,选择的合适,才能做出客观的评价,选择不合适,评价可能得出错误的结论。

对比分析法根据分析的特殊需要又有以下两种形式:

1)绝对数比较:它是利用绝对数进行对比,从而寻找差异的一种方法。

2)相对数比较:它是由两个有联系的指标对比计算的,用以反映客观现象之间数量联系程度的综合指标,其数值表现为相对数。由于研究目的和对比基础不同,相对数可以分为以下几种:

a)结构相对数:将同一总体内的部分数值与全部数值对比求得比重,用以说明事物的性质、结构或质量。如,居民食品支出额占消费支出总额比重、产品合格率等。

b)比例相对数:将同一总体内不同部分的数值对比,表明总体内各部分的比例关系,如,人口性别比例、投资与消费比例等。

c)比较相对数:将同一时期两个性质相同的指标数值对比,说明同类现象在不同空间条件下的数量对比关系。如,不同地区商品价格对比,不同行业、不同企业间某项指标对比等。

d)强度相对数:将两个性质不同但有一定联系的总量指标对比,用以说明现象的强度、密度和普遍程度。如,人均国内生产总值用"元/人"表示,人口密度用"人/平方公里"表示,也有用百分数或千分数表示的,如,人口出生率用‰表示。

e)计划完成程度相对数:是某一时期实际完成数与计划数对比,用以说明计划完成程度。

f)动态相对数:将同一现象在不同时期的指标数值对比,用以说明发展方向和变化的速度。如,发展速度、增长速度等。

3.6 二八法则

数据分析方法不是讲究高端大气上档次,而是讲究实用,并且是结合业务背景的实用方法才是最好的。只要实用,即便是最简单的排行榜、二八法则分析也可能是非常好的分析方法。很多刚刚毕业学统计的同学,在刚开始工作的半年甚至一年内往往比较迷茫,其一是自己在大学中学到的那些分析方法在实际工作中往往用不到或用得很少?其二是他们总想挖出一个“啤酒与尿不湿”式的经典案例才叫数据分析。这说明说明大家不熟悉业务,不了解数据分析是以实用为最高准则的。

1897年,意大利经济学家帕列托在对19世纪英国社会各阶层的财富和收益统计分析时发现:80%的社会财富集中在20%的人手里,而80%的人只拥有社会财富的20%,这就是“二八法则”。“二八法则”反应了一种不平衡性,但它却在社会、经济及生活中无处不在。附:破窗理论等在商品营销中,商家往往会认为所有顾客一样重要;所有生意、每一种产品都必须付出相同的努力,所有机会都必须抓住。而“二八法则”恰恰指出了在原因和结果、投入和产出、努力和报酬之间存在这样一种典型的不平衡现象:80%的成绩,归功于20%的努力;市场上80%的产品可能是20%的企业生产的;20%的顾客可能给商家带来80%的利润。遵循“二八法则”的企业在经营和管理中往往能抓住关键的少数顾客,精确定位,加强服务,达到事半功倍的效果。美国的普尔斯马特会员店始终坚持会员制,就是基于这一经营理念。“二八法则”同样适用于我们的生活,如一个人应该选择在几件事上追求卓越,而不必强求在每件事上都有好的表现;锁定少数能完成的人生目标,而不必追求所有的机会。

每次培训的时候我都会问学员两个问题:

1)你了解什么是二八法则吗?

2)你在实际的工作中使用过二八法则来做分析吗?

前前后后我问过好几百人,基本上100%的学员都了解二八法则,但是只有不到5%的学员在工作中曾经利用二八法则做过分析。二八法则是最简单、最广泛的一种分析方法,本应该广泛应用,但是大家把它当空气了。

二八法则可能是最简单、最有知名度的分析方法之一。大部分人都能随口说出几个自认为的二八法则数据。但是“20%的人用脖子以上挣钱,80%的人用脖子以下赚钱”,这不是严格意义上的二八法则,只能算二八比例。同样20%的人是富人,80%的人是穷人这也是二八比例,非二八法则。

二八法则是一种不平衡法则,即20%的对象产生80%的效果,20%是对象,80%是效果,前后不是一个范畴。这些才是真正的二八法则实例。

20%的客户贡献了80%的利润,20%的客户即为利润指标的重点客户;

20%的企业员工拿了公司80%的薪水,所以大家要做奋斗,期待早日成为管理层;

对女孩子来说,80%的时间只穿衣柜中20%的衣服,所以女孩子总感觉衣柜里面永远“少”一件衣服;

办公室中,80%的时间我们只是在20%的区域活动,所以这20%区域的地毯会更容易脏,也更容易破裂,有经验的物业人员会给这些地方单独铺一块地毯;

(1)“二八法则”在保险目标管理及时间管理上的运用

不同的管理层次上、不同的岗位上的人员,不管其内容有多大的差别,均有其工作的目标及工作的重点。我们必须明确目标,抓住重点,有所取舍,集中精力做属于我们该做的事。老总们花费80%以上的时间、精力在考虑经营目标、发展方向、计划决策等方面的问题,而业务人员则必须用80%的精力寻找客户,先做对的事情,然后再把事情做对。在时间的管理上,我们必须用20%的黄金时间做重要的事情,用垃圾的时间去处理垃圾的事情。因此在生活中,要切实找到那些影响我们工作效率的因素,从而让我们只需用20%的时间去做重要的占日常生活80%的事,真正发挥自身的优势,轻松达成目标。

(2)“二八法则”在保险代理人队伍中留存率及激励的运用

保险代理人的队伍流动性非常大,留存率也存在着二八现象,这就要求我们在增员甑选的时候,找对人,然后才能做对事。要想使服务达到优质化、产能提高,必须在一开始的时候就找到优秀的人才。留下20%的“对的”人,这将降低你的经营成本,提高你的工作效率。因为优秀的人较少犯错误,他们可以使你的企业有更高的效率即生产力。即使你付出再多的薪资也很值,因为你使自己更有效率了。找对了这20%的人,就有可能留存率达到80%了。

(3)“二八法则”在人员管理中的应用

保险公司与其他的销售公司一样,20%的展业人员销售80%的新保单,业务一边倒,明星挑大梁现象随处可见。只要你稍加注意,不管是大团队还是小团队,二八现象无处不在。因此保险公司必须特别重视绩优业务员的留存,绩优业务员进一步成长,绩优业务员对公司同仁的影响力等问题。从人力成本的角度分析,这部分人的人力成本是最低的,而产能是最高的。这20%的人员是领头的部队,是领头羊,是榜样,他们成长的速度将影响整个团队的成长速度,他们前进的步伐对整个团队起了决定性的作用。重视这支高效的群体,保险公司将获得更高的效率及效益。

(4)“二八法则”在客户管理中的应用

保险行销处在竞争激烈,“供大于求”的特定经营环境中,必须寻找属于自己的目标客户群,避免重复无效的行销资源浪费,从你做市场一开始,就要争取发现“对的”客户,懂得如何挑选客户并想办法“锁定”他们。用80%的精力找到20%属于自己的顾客,再以80%的服务满足这20%的人群。对于一家保险公司或一个保险展业人员,几乎都面临这样一种现象:80%的业务来自20%的客户。保险公司必须特别重视这20%的大客户、重点客户群,用80%的精力服务、巩固并发展这20%的客户。他们将为我们赢得80%的目标业务。在保有老客户的前提下,公司应遵循“80%的业务收入是由20%的大客户创造的这一定律,成立大客户部,直接服务于这20%的最优客户,并以各种方式提供VIP式的服务,留住他们,提高他们的忠诚度,进而发展自己,提高经济效益。保住了这20%的优质客户群,就等于保住了业务的半壁江山了。

3.7 RFM模型

根据美国数据库营销研究所Arthur
Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:

l 最近一次消费(Recency)

l 消费频率(Frenquency)

l 消费金额(Monetary)

1. 最近一次消费

  最近一次消费意指上一次购买的时候——顾客上一次是几时来店里、上一次根据哪本邮购目录购买东西、什么时候买的车,或在你的超市买早餐最近的一次是什么时候。

  理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应。营销人员若想业绩有所成长,只能靠偷取竞争对手的市场占有率,而如果要密切地注意消费者的购买行为,那么最近的一次消费就是营销人员第一个要利用的工具。历史显示,如果我们能让消费者购买,他们就会持续购买。这也就是为什么,0至6个月的顾客收到营销人员的沟通信息多于31至36个月的顾客。

  最近一次消费的过程是持续变动的。在顾客距上一次购买时间满一个月之后,在数据库里就成为最近一次消费为两个月的客户。反之,同一天,最近一次消费为3个月前的客户作了其下一次的购买,他就成为最近一次消费为一天前的顾客,也就有可能在很短的期间内就收到新的折价信息。

  最近一次消费的功能不仅在于提供的促销信息而已,营销人员的最近一次消费报告可以监督事业的健全度。优秀的营销人员会定期查看最近一次消费分析,以掌握趋势。月报告如果显示上一次购买很近的客户,(最近一次消费为1个月)人数如增加,则表示该公司是个稳健成长的公司;反之,如上一次消费为一个月的客户越来越少,则是该公司迈向不健全之路的征兆。

最近一次消费报告是维系顾客的一个重要指标。最近才买你的商品、服务或是光顾你商店的消费者,是最有可能再向你购买东西的顾客。再则,要吸引一个几个月前才上门的顾客购买,比吸引一个一年多以前来过的顾客要容易得多。营销人员如接受这种强有力的营销哲学——与顾客建立长期的关系而不仅是卖东西,会让顾客持续保持往来,并赢得他们的忠诚度。

2. 消费频率

  消费频率是顾客在限定的期间内所购买的次数。我们可以说最常购买的顾客,也是满意度最高的顾客。如果相信品牌及商店忠诚度的话,最常购买的消费者,忠诚度也就最高。增加顾客购买的次数意味着从竞争对手处偷取市场占有率,由别人的手中赚取营业额。

根据这个指标,我们又把客户分成五等分,这个五等分分析相当于是一个“忠诚度的阶梯”(loyalty ladder),其诀窍在于让消费者一直顺着阶梯往上爬,把销售想像成是要将两次购买的顾客往上推成三次购买的顾客,把一次购买者变成两次的。

3. 消费金额

  消费金额是所有数据库报告的支柱,也可以验证“帕雷托法则[计算机1] ”(Pareto’s Law)——公司80%的收入来自20%的顾客。它显示出排名前10%的顾客所花费的金额比下一个等级者多出至少2倍,占公司所有营业额的40%以上。如看累计百分比的那一栏,我们会发现有40%的顾客贡献公司总营业额的80%;而有60%的客户占营业额的90%以上。最右的一栏显示每一等分顾客的平均消费,表现最好的 10%的顾客平均花费1195美元,而最差的10%仅有18美元 。

  如果你的预算不多,而且只能提供服务信息给2000或 3000个顾客,你会将信息邮寄给贡献40%收入的顾客,还是那些不到1%的顾客?数据库营销有时候就是这么简单。这样的营销所节省下来的成本会很可观 。

  结合这三个指标,我们就可以把顾客分成5*5*5 = 125类,对其进行数据分析,然后制定我们的营销策略。

  最近一次消费、消费频率、消费金额是测算消费者价值最重要也是最容易的方法,这充分的表现了这三个指标对营销活动的指导意义。而其中,最近一次消费是最有力的预测指标。

4. RFM模型 - RFM模型的应用意义

在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。RFM模型是衡量客户价值和客户创利能力的重要工具和手段。该模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。

RFM模型较为动态地层示了一个客户的全部轮廓,这对个性化的沟通和服务提供了依据,同时,如果与该客户打交道的时间足够长,也能够较为精确地判断该客户的长期价值(甚至是终身价值),通过改善三项指标的状况,从而为更多的营销决策提供支持。

  在RFM模式中,R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。一般的分析型CRM着重在对于客户贡献度的分析,RFM则强调以客户的行为来区分客户。

RFM非常适用于生产多种商品的企业,而且这些商品单价相对不高,如消费品、化妆品、小家电、录像带店、超市等;它也适合在一个企业内只有少数耐久商品,但是该商品中有一部分属于消耗品,如复印机、打印机、汽车维修等消耗品;RFM对于加油站、旅行保险、运输、快递、快餐店、KTV、行动电话信用卡、证券公司等也很适合。

RFM可以用来提高客户的交易次数。业界常用的DM(直接邮寄),常常一次寄发成千上万封邮购清单,其实这是很浪费钱的。根据统计(以一般邮购日用品而言),如果将所有R(Recency)的客户分为五级,最好的第五级回函率是第四级的三倍,因为这些客户刚完成交易不久,所以会更注意同一公司的产品信息。如果用M(Monetary)来把客户分为五级,最好与次好的平均回复率,几乎没有显著差异。

  有些人会用客户绝对贡献金额来分析客户是否流失,但是绝对金额有时会曲解客户行为。因为每个商品价格可能不同,对不同产品的促销有不同的折扣,所以采用相对的分级(例如R、F、M都各分为五级)来比较消费者在级别区间的变动,则更可以显现出相对行为。企业用R、F的变化,可以推测客户消费的异动状况,根据客户流失的可能性,列出客户,再从M(消费金额)的角度来分析,就可以把重点放在贡献度高且流失机会也高的客户上,重点拜访或联系,以最有效的方式挽回更多的商机。

RFM也不可以用过头,而造成高交易的客户不断收到信函。每一个企业应该设计一个客户接触频率规则,如购买三天或一周内应该发出一个感谢的电话或Email,并主动关心消费者是否有使用方面的问题,一个月后发出使用是否满意的询问,而三个月后则提供交叉销售的建议,并开始注意客户的流失可能性,不断地创造主动接触客户的机会。这样一来,客户再购买的机会也会大幅提高。

  企业在推行CRM时,就要根据RFM模型的原理,了解客户差异,并以此为主轴进行企业流程重建,才能创新业绩与利润。否则,将无法在新世纪的市场立足。

3.8 数据分析的结论与意义

关于数据分析的方法很多,得出的结论也会很多,而数据分析结论该怎么总结才更有意义,业务运营才看的明白。有次在给某家移动电台App做数据分析的时候,也结合了大量的市场调研数据和图表以及案例分析,最后给他们做结论和建议的时候,他们还是觉得有些混乱,说老师我们还是没有听的太明白。所以在做数据分析这块,不是你工作的时间比较久,你在数据分析的专业能力很强,你就能做好数据分析的工作,你还要能让别人听明白你的想法和表示的意思。后来我了解到,在进入现场之前,我想当然的认为他们都是做业务运营或者技术开发背景的,而后来问了之后统计了现场有大量做公关或者刚毕业的学生。对于这样背景的,你讲述太多专业名词和商业模式他们就不太能够很快接受。所以在做数据分析结论的时候,总结了以下几点:

1)了解你的沟通对象,知道他们平时都是做什么,痛点问题有哪些,需要得到什么帮助;

2)数据分析结论一定要精炼而非多,如果可以的话,一个分析一个最重要的结论就好了,很多时候分析就是发现问题,如果一个一个分析能发现一个重大问题,就达到目的 了,不要事事求多,宁要仙桃一口,不要烂杏一筐,精简的结论也容易让阅者接受,减少重要阅者(通常是事务繁多的领导,没有太多时间看那么多)的阅读心理门 槛,如果别人看到问题太多,结论太繁,不读下去,一百个结论也等于0;

3)结论一定要明确,没有明确的数据分析结论就不叫分析,也失去了数据分析师的意义,对于自己所做的数据分析工作一定要清楚自己是希望得出什么样的结论;

4)分析结论一定要有严密的推倒过程,不要有猜测性的结论,太主观的东西会没有说服力,如果一个结论连你自己都没有肯定的把握就不要拿出来误导别人了;

5)数据分析结论要尽量让人能够读懂读明白,特别是在图表化上,不要给人家挖坑。

而数据分析的意义远不止是抛给听众一个绣花球,亦或是锦上添花。只有雪中送炭般的具体解决方案和实际行动才能让业务方觉得这是最有价值的东西。所以围绕整个解决方案怎么开展,可能有哪些问题,以及预期的效果会是什么样子,这些都是作为一个项目成员数据分析师需要做的事情。而中间可能会有项目的调整,可能会有沟通成本的问题,也可能你的分析结论不一定正确,而这些都是在不断迭代优化过程中必须要经历的。这其中的策略需要怎么优化调整,沟通技巧该有哪些,都是考验一个数据分析师的软技能。最后数据分析在业务中的价值发挥出来的时候,业务也会越来越离不开数据分析的支持和指导。

推荐 1
本文由 面包君 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册