【Friday BI Fly】2016年8月26日交流基于数据挖掘的汽车行业客户行为特征分析 文字版记录

浏览: 2521

公告:

周五BI飞起来,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴,锁定在每周五晚20:30,不见不散!

未来几期的微信直播活动分享主题将包括谈谈BI在生产企业的应用、据挖掘在人工智能的入门应用、互联网行业数据化运营最佳实践、 地理大数据如何驱动智慧选址、互联网公司数据分析之道等,具体日期安排请关注天善智能问答社区活动版块https://www.hellobi.com/events


本期分享内容

基于数据挖掘的汽车行业客户行为特征分析


本期嘉宾介绍

结实  曾从事产业咨询,地产咨询,汽车行业咨询。 《数据分析与挖掘案例分析实践》视频教程老师 

博客专栏:

https://ask.hellobi.com/blog/jieshi0602 

数据分析与挖掘案例分析实践免费视频教程:

https://edu.hellobi.com/course/83

主持人:咖啡:大家好,我是微信直播活动的主持人咖啡,每周一个主题,一场跟数据有关的行业、工具、技术的交流盛宴。我们的口号是“Friday BI Fly 周五BI飞起来”。

下面我们就正式开始今天的活动了,关于我们的微信直播活动,新来的朋友可能还有各种疑问,下面我就针对常见问题给大家做个解答。

  数据挖掘汽车行业客户行为特征分析

结实: 

大家好,我是结实,本次分享的题目是《基于数据挖掘的汽车行业客户行为特征分析》。 

主要思路是以汽车行业为载体,通过对具体业务需求的理解与梳理,转化为数据分析问题,进行数据建模,将输出的结果应用到业务中,对业务提供支持(建议,预测,判断等等)。

当然了,数据分析与挖掘的过程也是持续地与业务碰撞的过程,这是一个反复建模分析,反复验证解释的过程。此次分享的内容以解决思路为主,关于具体技术,大家可到天善社区学习(学院,博客,问答等等)。 

行业知识铺垫

数据挖掘是以业务为核心。因为业务决定了数据分析与挖掘的方向与重心。 

每一个行业都有一个所谓的客户生命周期,对于汽车行业来说,客户生命周期是,认知、需求、选车、购车、用车、修车、换车。见下图: 

每一个点表示的是,客户在不同的生命周期阶段所获取信息或服务的途径。而我们的目标是在客户生命周期每个阶段均采取针对性措施增加客户价值(为客户增加价值就是增加每一个客户对企业的生命价值)。目标分解:增加客户的生命时间增加每一次与客户互动所得的收入。 

下面分享一下实际业务场景:

客户流失预警分析!背景:

客户流失的危害

1,盈利损失:客户忠诚度下降,企业利润下降;

2,口碑损失:60%新客户参考现有客户的推荐;一个不满的客户扩散范围大5-6倍(与满意客户比);

3,成本增加:开发一个新客户成本=维系六个老客户成本。 

需要回答的问题:哪些客户流失了?什么时候流失? 流失客户价值如何?回答以上问题,就可以对即将流失客户做相应的动作给予挽回(数据对业务的支持)。 

解决思路:切记:解决问题过程的每一步都要与业务进行碰撞(特征的探索,建立模型时候的参数及区间的设定等等),业务诉求及结论需要数据分析进行支持,数据分析结果(探索的结果)需要业务进行验证解释。 

步骤

1,根据业务梳理所需指标;

2,了解各字段来源,权重分配与评分方式确立;

3,建立模型,验证优化; 

4,根据结果提出相应建议(跟踪时间,优惠点等等)(略)

 建模思路

1,筛选客户消费频次,金额,推荐等特征,建立客户价值分类模型,

2,对比已流失用户与保有用户,寻找显著特征;

3,依据筛选出的特征,建立流失预警模型;

4,结合分类模型与流失模型,对用户进行差异性营销。

其实这个是两个模型的结合! 

客户价值分析(模型):客户价值区分(根据历史消费行为等记录,测算当前价值,对客户进行区分)。

流失预警分析(模型):依据客户历史维保周期等信息,及时预警超期未进店客户。 

客户价值分析(模型)

我们从两个维度进行构建客户价值分析(模型)。物质价值(以客户消费的相关数据为依据,反应客户带给企业的货币形式的价值)和情感价值(以客户与车型品牌的互动的相关数据为依据,反应客户对车型品牌的依赖度、忠诚度等非货币形式的价值)。 

支撑物质价值的字段包括:维保金额,维保频次,最近维保时间等;支撑情感价值的字段包括:年均积分获取次数,年均积分使用次数,年均参加活动次数,投诉记录,推荐购车等等。

以上是提取字段,接下来是衍生字段(如年均次数等)(略) 

模型是k-means聚类。 

我们将客户按价值分为高中低等(具体字段不赘述)。 

下一步是做客户流失模型! 

就当前时间点而言,最后一次进店时间距当前时间大于等于12个月,标记为流失,最后一次进店时间距当前时间小于12个月,标记为未流失。 

60%放入训练集,40%放入测试集。模型为决策树。同时我们对已流失客户进行特征提取,分析如下:

流失客户集中在购车后2年左右的时间 

车龄三年的用户流失比重达25%,车龄五年以上用户已经有近半流失。 

流失前也伴随着某些特征

1. 流失前后有明显的积分获取使用的频次下降; 

2. 流失用户金额波动更大,多经历高维保金额 ; 

3. 流失用户流失前最后一次进店原因为‘事故车’比率达22%,更换常去经销商比率为15%。 我们将两个模型导出的结果标识(每一条记录都有标识)进行取交集操作,如下图所示

 我们会对量化后的指标进行离散化处理(将具体的定量指标定义为定性指标)。

下一步就是将数据进行打包,附上针对性的跟踪服务建议(数据分析支持的结果),下发经销商,相关人员进行跟踪反馈。

因为牵扯面太大(区域--全国,人员--业务水平参差不齐等等),对跟踪反馈结果的收集难度很大。 

以上是本次的微信分享,谢谢大家,下面是讨论沟通时间,欢迎大家踊跃发言。 

咖啡: 

好的,感谢结实老师给大家带来的精彩分享,客户行为方面的分析对每个行业来说都是挺重要的,老师直接从最关键的点切入来让大家感受数据挖掘的价值,现在就要进入自由提问时间了,对今晚分享内容有疑问或日常工作中遇到的问题,都可以把问题抛出来了,让结实老师来帮助你!

自由讨论

问题一、流失率怎么计算的? 

结实:流失率是某段时间内,流失客户/(保有客户+流失客户),一般情况下,流失定义,最后一次到店时间距当前时间大于一年(因车型不一样,会稍有变动) 

问题二、老师您好,业界普遍如何定义流失和忠诚客户呢,有行业标准吗? 

结实:忠诚客户的特征包括,积分大于平均积分,消费积分相对及时,维保频次相对较高,有投诉记录,等等。评估客户价值,从两个维度(物质和精神,这是与业务碰撞的结果),接下来进行细分到变量,客户价值是一个综合评判的结果。 

问题三、同时,流失前也伴随着某些特征:这个是决策树发现的特征吗? 

结实:是的,大部分来源于决策树模型。另外那样二维坐标图,决策树如何得到流失率高中低的 是通过定量数据定性化,比如流失率60%-100%为高流失,以此类推。 

问题四、汽车行业常用的KPI指标有哪些? 

结实:kpi指标:因为针对的群体不一样,所以kpi指定不一样。我们针对的是客户,不涉及kpi,如果非要定义kpi指标,那就是维保频次,维保金额,积分获取与消费,进店频次等 

问题五、初学数据挖掘,想问一下老师做数据挖掘的关键是什么?

结实:数据挖掘理论,业务知识,工具熟练程度都是关键。其实最关键的是沟通能力。与技术同事的沟通,与业务同事的沟通,与客户的沟通。

问题六、还有请问一个 流失用户 还有不是流失 用户 这些在哪个特征上判断区别呢?但是这个形成了特征后怎么判断预测后边的客户是属于流失的 ?是不是定了阀值只要过了就是属于了?

结实:如果单从人口属性上无非判断啊,但是从消费频次上倒是可以;流失客户的判断是进店时间是否超过了1年,业务经验。

问题七、数据挖掘未来在哪些行业作用会越来越大?

结实:数据的积累丰富行业。互联网,医疗,交通等

问题八、老师,请教一个问题,上面展示的Kmeans是个二维变量的图,但是一般的聚类变量都是3维以上,请教该如何展示?

结实:可以做三维图,图只是一个直观的感觉,数据分析结果,更多的是看数据

问题九、老师这样的工作在车企主要是什么部门?

结实:CRM部门

问题十、保内保外保养频次应该很不同感觉 是的,我们只分析保内 3年以上流失数据是因为续保了吗?

结实:要是保修期到了,很多人是价格敏感的,虽然按照同样的价格维保,但可能3年后才有差值。另外,对于感情评估数据是怎么弄到的,也很感兴趣 感情是与多部门人员的碰撞,也是一个探索吧,当时感情占的比重不是很大

主持人:主持人:感谢老师耐心细致的回答,由于时间关系,咱们今天的活动要接近尾声了,大家还有疑问的,直接提问到https://ask.hellobi.com/question老师会在社区上面给予回答

今天的微信直播活动到这里就结束了,喜欢天善智能的朋友们请继续关注我们,每周五晚8:30,我们不见不散哦!

下期预告

2016年09月02日晚8点半微信直播交流谈谈BI在生产企业的建设与应用交流会第31场https://www.hellobi.com/event/99


每周 Friday BI Fly 微信直播参加方式,加个人微信:fridaybifly,并发送微信:公司+行业+姓名,即可参加天善智能微信直播活动。


天善智能 www.hellobi.com 是一个专注于商业智能BI、数据分析、数据挖掘和大数据技术的垂直社区平台(国内唯一的数据类技术问答社区、博客、在线学院)。

天善智能拥有国内最大的数据领域社群组织,每周五晚上 8:30 Friday BI Fly 30+ 微信群同步直播行业和大数据技术交流。

Saturday BI Fly北上广深以及全国其它各个城市 200-500人规模的大数据沙龙活动。


关注天善智能,关注大家都在关注的大数据社区

推荐 2
本文由 天善智能 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

1 个评论

辛苦了

要回复文章请先登录注册