八大直播作业 - 第七讲作业

浏览: 1400

作业内容:

C银行信用卡中心在对欺诈风险和反欺诈技术作了充分研究之后,融合内外部数据,建立以评分模型为支撑的欺诈识别和防范系统,以满足精细化管理的需要。本次作业根据提供的数据(“FRAUD_TRAIN_Samp.csv”,引用自陈春宝等出版的《SAS金融数据挖掘与建模》)建立信用卡申请反欺诈模型。

解答步骤:

1)使用决策树、神经网络、组合算法建立反欺诈模型,比较三个模型的表现。

2)自学绘制PR曲线:横轴为精确度(Precise),纵轴为召回率(Recall)

作业结果:

1)用了决策树, 神经网络和随机森林,SMOTE过采样后的数据表现优于原始数据、随机过采样和综合采样;而决策树结果又优于神经网络和随机森林。

2)使用函数:metrics.precision_recall_curve 来绘制PR曲线, 红线为训练样本,蓝色为测试样本。可以看出测试样本中的target=1的值很少

下图X轴为Precise, Y轴为Recall

image.png

下图X轴为Recall, Y为Precise

image.png

PS:采样数据中NaN值比较多,在数据预处理中去除了列‘F75’开始的所有列,将列‘F46’中NaN值用‘-1’替换。

Precision:预测为对的当中,原本为对的比例,越大越好,最大为1

Recall:原本为对的当中,预测为对的比例,越大越好,最大为1

推荐 0
本文由 oceanji 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册