Python数据分析与数据化运营:会员数据化运营2-应用场景与分析模型

浏览: 3518

作者介绍:宋天龙(TonySong),资深大数据技术专家,历任软通动力集团大数据研究院数据总监、Webtrekk(德国最大的网站数据分析服务提供商)中国区技术和咨询负责人、国美在线大数据中心经理。


本文来自《Python数据分析与数据化运营》配套书籍第5章节内容,机械工业出版社华章授权发布,未经允许,禁止转载!

此书包含 50个数据工作流知识点,14个数据分析和挖掘主题,8个综合性运营案例。涵盖了会员、商品、流量、内容4大数据化运营主题,360°把脉运营问题并贴合数据场景落地。

书籍购买链接:https://item.jd.com/12254905.html

课程学习链接:网站数据分析场景和方法——效果预测、结论定义、数据探究和业务执行https://edu.hellobi.com/course/221


往期回顾:Python数据分析与数据化运营:会员数据化运营1-概述与关键指标 


5.3 会员数据化运营应用场景

会员数据化运营主要应用于会员营销和会员关怀两方面。

5.3.1 会员营销

数据化运营应用于会员营销主要体现在以下几个方面:

  • 信息化的方式建立基于会员的客户关系管理系统,促进所有会员数据的信息化
  • 通过特定方法普通用户拓展企业会员,并提高会员留存率
  • 基于用户历史消费记录,挖掘出用户潜在消费需求及消费热点
  • 基于历史数据,为会员营销活动提供策略指导和建议,促进精准营销活动的开展
  • 会员营销结果中寻找异常订单或转化,作为黄牛VIP客户识别的参考
  • 挖掘会员传播关系,找到口碑传播效应的关键节点

5.3.2 会员关怀

数据化运营应用于会员关怀主要体现在以下几个方面:

  • 预警事件设置阀值,自动触发应急处理机制
  • 分析会员行为,为会员提供个性化、精准化差异化服务
  • 通过会员喜好分析,提高客户忠诚度、活跃度和粘性
  • 通过会员分析,预防会员流失并找到挽回已经流失会员的方法
  • 基于会员群体行为,更好的划分会员群体属性并挖掘群体性特征
  • 基于群体用户和内容相似度,发现价值的会员互动方式
  • 基于会员生命周期的关怀管理,促进用户终生价值最大化

5.4 会员数据化运营分析模型

在会员数据化运营分析模型中,将主要介绍会员细分模型、会员价值度模型、会员活跃度模型、会员流失预测模型、会员特征分析模型营销响应预测模型

5.4.1 会员细分模型

会员细分模型是将整体会员划分为不同的细分群体或类别,然后基于细分群体做管理、营销和关怀。会员细分模型常用于在整体会员的宏观性分析以及探索性分析,通过细分建立初步认知下一步的分析和应用提供基本认知会员细分也是做精准营销的基本前提。

常用的细分模型包括:基于属性的方法ABC分类法、聚类法等

基于属性的方法

会员细分可以基于现有会员属性,常的细分属性包括:会员地域(例如北京、上海、武汉等、产品类别(例如大家电、3C数码、图书等、会员类别(例如大客户、普通客户、VIP客户会员性别(例如男、女、未知、会员消费等级(例如高价值会员、中价值会员、低价值会员)、会员等级(例如钻石、黄金、白银)等。这种细分方法可以直接利用现有会员数据库数据,无需做二次开发和计算,一种比较简单粗犷的方法。

ABC分类法

ABC分类法(Activity Based Classification)是根据事物的主要特征做分类排列,从而实现区别对待、区别管理的一种方法。ABC法则是帕累托二八法则衍生出来的一种法则。不同的是,二八法则强调的是抓住关键,ABC法则强调的是分清主次,并将管理对象划分为ABC三类。

ABC分析法中先将目标数据列倒叙排序,然后做累积百分比统计,最后将得到的累积百分比按照下面的比例值划分为ABC三类

  • A类因素,发生累计频率为0%~80%,是主要影响因素。
  • B类因素,发生累计频率为80%~90%,是次要影响因素。
  • C类因素,发生累计频率为90%~100%,是一般影响因素。

下面示例数据说明如何使用ABC分类法对会员做细分

步骤1 先建立一个二维表格数据,数据中包括会员ID订单金额(或其他关键指标两列。

步骤2 二维表格数据按照订单金额做倒叙排序。

步骤3 订单金额列做累积百分比统计

步骤4 按照ABC划分标准将会员划分为不同的分类得到如表5-3所示数据

image.png

聚类法

使用聚类法做会员分群是常用的非监督式方法,该方法无需任何先验经验,只需要指定要划分的群体数量即可。有关聚类分析的具体操作方法,请查看“4.1.6 代码实操:Python聚类分析

5.4.3 会员价值度模型

会员价值用来评估用户的价值情况,是区分会员价值的重要模型和参考依据也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生,衡量的是有实体转化价值的行为。常用价值度模型是RFM

RFM模型是根据会员最近一次购买时间RRecency)、购买频率FFrequency)、购买金额MMonetary)计算得出RFM得分,通过这三个维度来评估客户的订单活跃价值,常用来做客户分群或价值区分。该模型常用于电子商务(即交易类)企业的会员分析。

RFM模型基于一固定时间点来做模型分析,因此今天做的RFM得分7天前做的结果可能不一样原因是每个客户在不同的时间节点所得到的数据不同。以下RFM模型的基本实现过程:

步骤1设置要做计算时的截止时间节点(例如2017-5-30,用来做基于该时间的数据选取和计算。

步骤2 会员数据库今天时间界限向前推固定周期(例如1得到包含每个会员的会员ID、订单时间、订单金额的原始数据集,一个会员可能会产生多条订单记录

步骤3 数据预计算。从订单时间中找到各个会员距离截止时间节点最近的订单时间作为最近购买时间;以会员ID维度统计每个用户的订单数量作为购买频率,将用户多个订单的订单金额求和得到订单金额。由此得到RFM三个原始数据量。

步骤4 RFM分区对于FM变量来讲,值越大代表购买频率越高、订单金额越高;但对R来讲值越小代表离截止时间节点越近,因此值越好。对RFM分别使用五分位(三分位也可以分位数越多划分的详细法做数据分区需要注意的是,对于R来讲需要倒过来划分,离截止时间越近的值划分越大。这样得到每个用户的RFM三个变量的分位数

步骤5 三个值组合或相加得到总的RFM得分。对于RFM得分的计算有两种方式,一种是直接将三个值拼接到一起,例如RFM得分312333132;一种是直接三个值相加求得一个新的汇总值,例如RFM得分696

在得到不同会员RFM的之后根据步骤5产生的两种结果有不用的应用思路:

思路1基于三个维度值做用户群体划分和解读,对用户的价值度做分析例如得分为212会员往往购买频率较低,针对购买频率低的客户定期发送促销活动邮件;针对得分为321会员虽然购买频率高但是订单金额低等,这些客户往往具有较高的购买粘性,可以考虑通过关联或搭配销售的方式提升订单金额。

思路2:基于RFM汇总得分评估所有会员的价值度价值,并可以做价值排名;同时,该得分还可以作为输入维度其他维度一起作为其他数据分析和挖掘模型的输入变量,为分析建模提供基础。

提示 上述示例模型的三个维度权重是相同的,可以根据不同企业的需求为RFM设置不同权重值然后通过加权的形式得到符合运营需求的得分。

5.4.2 会员活跃度模型

会员活跃用来评估用户的活跃度情况,是会员状态分析的基本模型之一。“5.2.3 会员活跃度指标”中的整体活跃度指标中介绍了一种基于加权统计的方法,在此再介绍另一种活跃度模型——RFE模型

RFE模型基于用户的普通行为(非转化交易行为)产生它跟RFM类似都是使用三个维度做价值评估。RFE模型是根据会员最近一次访问时间RRecency)、访问频率FFrequency)和页面互动度EEngagements)计算得出的RFE得分。其中

  • 最近一次访问时间RRecency):会员最近一次访问到达网站的时间
  • 访问频率FFrequency):用户在特定时间周期内访问或到达的频率
  • 页面互动度EEngagements):互动度的定义可以根据不同企业的交互情况而定,例如可以定义为页面浏览量、下载量视频播放数量等。

RFE模型中,由于不要求用户发生交易,因此可以做未发生登录、注册等匿名用户的行为价值分析,也可以做实名用户分析。模型常用来做用户活跃分群或价值区分,可用于内容型(例如论坛、新闻、资讯等)企业的会员分析。

RFMRFE模型的实现思路相同,仅仅是计算指标发生变化。对于RFE数据来源,可以从企业自己监控的用户行为日志获取,也可以从第三方网站分析工具获得。

在得到用户的RFE得分之后,RFM类似也可以两种应用思路

思路1基于三个维度值做用户群体划分和解读,对用户的活跃度度做分析RFE得分313会员说明其访问频率低,但是每次访问时的交互都非常不错,此时重点要用户回访频率的提升,例如通过活动邀请、精准广告投放、会员活动推荐等提升回访频率

思路2:基于RFE汇总得分评估所有会员的活跃度价值,并可以做活跃度排名;同时,该得分还可以作为输入维度其他维度一起作为其他数据分析和挖掘模型的输入变量,为分析建模提供基础。

注意 无论RFM和RFE都不要忽略不同的消费频率、品类和周期对于结果的影响性。例如大家电的更换周期可能2年、手机的更换频率1年、日用消费品的周期却是7天,由于不同品类的差异性很大,最终得到的得分结果没有必然的可比性,例如偏向于购买大家电品类的RFM得分113属于“正常现象因为大家电的购买属性决定了这就是一个周期、低频、大金额行为。

5.4.4 会员流失预测模型

会员流失预测模型用来预测会员是否流失,是会员生命周期管理的重要预防性应用。会员流失模型的关键因素之一是要定义好流失即处于何种状态、具备哪些特征的会员属于流失会员;另外,流失也可能区分是永久性流失还是临时性流失。常见的属于流失的状态定义示例:

  • 会员已经退订公司的促销活动
  • 会员打电话要求将自己的信息加入通知黑名单
  • 会员已经连续6个月没有登录过网站
  • 针对会员发送的关怀激励活动中没有任何有效反馈和互动
  • 会员最近1年内没有任何订单

上述流失状态可以归为两类:一类是会员有明确的表达,不再希望接收到公司的相关信息;一类是会员没有明确的表示,但是在业务关注的主要领域内,没有得到有效反馈。

会员流失预测模型的实现方法属于分类算法,常用算法包括逻辑回归、支持向量机、随机森林等,有关这些算法的具体选择问题,请参照“4.3.5 如何选择分类分析算法

做会员流失预警模型时,需要注意以下几个问题:

  • 流失会员的样本分类一定是少数类,需要注意处理样本不均衡问题。
  • 对于流失会员的预测结果,得到概率性的输出可以结合流失预测标签一起应用,因为业务方可以基于概率再结合业务经验做判断。
  • 对于参与训练模型的维度变量的选择,一定要结合业务经验,因为业务方对于特定场景的判断影响训练模型和应用结果关键因素之一。
  • 输入的维度变量中一定要包含发生转化前的行为数据,假如业务定义为最近6月没有订单的客户为流失客户,那么在做预测模型时需要将用户的匿名访问、登录、页面浏览、搜索、活动咨询等转化前的数据考虑在内,而不只考虑订单转化本身。
  • 会员流失预警模型不是一次性,而是周期性监视和运行的,例如每天每周或至少是每月。

通过会员流失模型得到每个会员是否属于流失标签,可以将该结果给到会员运营人员,运营人员一般会根据业务经验做二次审查和确认,然后再通过会员挽回、激励等机制提升会员的忠诚度,延缓或防止会员流失。而关于如何挽回以及激励的问题,通常也是需要数据参与来帮助运营人员制定相应的策略,例如在合适的时间、以恰当的方式提供个性化内容给特定会员,这些都需要数据的支持。

5.4.5 会员特征分析模型

会员特征分析模型是针对现有会员做特征分析。会员特征分析模型提供的结果可能是模糊的,也可能是明确的。例如

  • 明确的特征,它提供业务所要行动的细节要素,是一种具有极高落地价值的数据分析工作。
  • 模糊的特征它指数据分析结果提供详细动作因素,仅指明了下一步行动方向或目标

会员特征分析主要应用于以下两种业务场景

第一种是在没有任何前期经验或特定目标下触发,希望通过整体特征分析了解会员全貌。在这种模式下,可以通过一定方法先将用户划分为几个类别,然后再做基于类别的特征分析,常用实现方法应用包括

  • 聚类通过聚类将用户划分为几个群组,然后分析不同群组的典型特征和群组间的差异性。例如公司的总体会员具有哪些特征?模型结果通过聚类方法将会员划分为3,然后每个类别都有各自显著性特征,会员部门可根据不同类别特定分析并指定群体性策略。
  • 统计分析将整体用户做统计分析,包括描述性统计、频数分布等,了解整体数据概括。
  • 第二种是有明确的业务方向,希望找到达到事件目标的会员特征,用于做进一步的会员运营对于这类分析模型,常用的实现方法应用包括:
  • 分类:利用分类规则例如决策树找到符合目标的关键变量以及对应的变量值,进而确定会员特征。例如收入>5400,最近购买时间5月之前,总订单金额在4300以下的会员可能购买商品。
  • 关联:使用关联规则找到不同属性、项目间的关联发生或序列发生关系,然后将会员的属性特征(频繁项集)提供给运营。例如购买X商品的客户一般是来自于上海、购物频率为13、客单价为100以下
  • 异常检测:使用非监督式的异常检测方法,从一堆数据中找到异常数据样本,然后将这些数据样本特征提供给运营做进一步确认和审查。例如异常客户的特征往往每次订单的商品数量超过4、地域集中在江苏浙江、一般拥有超过3以上的子账户。

会员特征分析模型输出的上述两类结果第一类结果往往作为辅助于、启发性和提示性结果,用于为运营提供进一步业务动作的思考,这种一般开始于数据工作项目的开始或业务方对数据主题先验经验不足的情况下;第二类结果则可以作为运营下一步动作的直接触点

5.4.6 营销响应预测模型

营销响应预测模型是针对营销活动展开的,通常在做会员营销活动之前,通过营销响应预测模型分析找到可能响应活动的会员特征以及整体响应的用户比例、数量和可能带来的销售额会员营销之前有关策略制定辅助价值非常明显

营销响应预测模型实施采用的一般是分类算法,常见算法包括,常用算法包括逻辑回归、支持向量机、随机森林等,有关这些算法的具体选择问题,请参照“4.3.5 如何选择分类分析算法

在做营销响应模型之前,需要先收集训练所需的数据集

步骤1 从所有会员上随机选择一定量的会员样本具体数量根据企业实际情况而定,一般情况下,至少要有1000数据以上(同时要兼顾总体会员数量才能满足模型训练的需要

步骤2 然后针对选择会员样本通过一定媒介和渠道发送营销活动信息,例如手机短信、电子邮件等。需要注意的是,一定要记录好营销活动发送的时间、频率信息等关键运营要素,这些需要跟后期实施保持一致。

步骤3 收集营销活动数据收集数据时需要注意数据收集的周期,通常情况下,一般电子邮件的有效周期为1~7左右,时间过短可能无法被用户看到;手机短信的有效期一般是1左右,时间太长用户一般会忽略。

经过上述步骤收集到分类所需的样本集之后,接着就需要通过分类模型做营销响应预测,这是典型的二分类问题。在做营销响应模型训练,也需要注意在5.4.4 会员流失预测模型”提到的问题,二者在很多方面都有共通性

通过营销响应预测模型得到的结果一般包括两个方向

一是:基于模型找到最可能产生购买转化行为的会员规则特征。例如最近一次购买时间在3月以内、会员等级3以上、总订单金额大于3000订单量大于10客户。通过这些条件直接从数据库筛选对应的会员列表,并可以该会员列表发送营销活动。

二是基于模型预测可能产生的订单转化数量转化率(例如选择10000客户,会有4000个客户产生转化)以及有转化客户的客单价(通过训练样本集选择有转化客户然后订单金额/会员量计算得到)大体计算出此次发送会员得到的营销收入。这些信息可以作为此次营销活动计划提报的数据量化指标资源申请的数据支持。

推荐 0
本文由 Python爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册