一、HW4
要求如下:
1、首先对loss重新编码为1/0,有数值为1,命名为loss_flag
2、对loss_flag分布情况进行描述分析
3、分析是否出险和年龄、驾龄、性别、婚姻状态等变量之间的关系(提示:使用分类盒须图,堆叠柱形图)
作业内容:
1.data['Loss_flag'] = data['Loss'].apply(lambda x:1 if x > 0 else 0):判断是否大于0
2.data['Loss_flag'].describe():进行描述分析
3.由以下的各图可得出以下结论:是否出险与性别、婚姻状况、年龄无太大关系,但与驾龄有关
二、HW5
要求如下:
使用提供的数据集作以下分析:(参考免费视频:数据科学实战:Python篇(案例:个人贷款违约预测模型)- https://edu.hellobi.com/course/270/lessons)
1、不同类型卡的持卡人的性别对比
2、不同类型卡的持卡人在办卡时的平均年龄对比
3、不同类型卡的持卡人在办卡前一年内的平均帐户余额对比
4、不同类型卡的持卡人在办卡前一年内的平均收入对比
作业内容:
需对以下内容进行处理:a.需对相关的表进行关联;b.需要处理相关日期格式,以方便计算年龄等;c.将账户余额,金额转化为数值型。
1、
2、
3、
4、