使用提供的数据集作以下分析:
(参考免费视频:数据科学实战:Python篇(案例:个人贷款违约预测模型)- https://edu.hellobi.com/course/270/lessons)
代码路径如下:, 同样用到的预定义方法stack2dim
有几点要注意:
对于trans表中的balance和amount字段,由于格式不统一,要做数据整理
对于issued值为2月29日的,计算一年前同一天, 这里用了3月1日:如issued='1996-2-29', 一年前的日期就采用了'1995-3-1'
多表查询用了left join, cards为出发表,主表
好像并不是所有提供的数据在这次习题中都被用到
1、不同类型卡的持卡人的性别对比:
2、不同类型卡的持卡人在办卡时的平均年龄对比:
3、不同类型卡的持卡人在办卡前一年内的平均帐户余额对比:
4、不同类型卡的持卡人在办卡前一年内的平均收入对比: