使用Pandas进行用户群组分析

浏览: 1216

本文是《数据蛙三个月强化课》的第八篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉用户群组分析知识,大可不必再看这篇文章,或是只挑选部分文章

想有个自己的办公室想有个自己的办公室

一、什么是群组分析(Cohort Analysis)?

群组是具有共同特征的一组用户,比如2月份来到我们数据蛙同学为一组相同的用户,3月份来的同学为另外一组用户,这样我们就可以对比不同组同学在数据蛙社群的留存、活跃、付费的情况,进而可以思考当时在2月和3月份做出的活动产生的影响。我们先看一张图

RetentionRetention

来我们一起看下,纵轴表示留存率,横轴表示用户第一次购买后,之后每个月的留存率,图中的三条线分别表示用户在6月、7月8月**发生第一次购买之后几个月的留存率情况。

二、通过案例得出上图

  • 先观察下数据(数据见文末)

    数据显示有用户的OrederId、OrderDate、UserId、TotalCharges(我们只会用到这四个),其他的字段没有太清楚
  • 生成一个新的字段,用户订单的月份
  • 生成用户群组字段

  • 每个用户群下每一个月份的用户数量、订单数量、购买金额

  • 把每个群组的继续购买的日期字段进行改变

  • 得到每个群组的用户量


  • 计算每个群组的留存

  • 折线图展示

  • 热力图展示

参考资料
1.Cohort Analysis with Python
2.数据链接

推荐 0
本文由 DataFrog 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册