天善学习

在天善智能学习数据科学所做的作业

0
推荐
1401
阅读

八大直播作业 - 第七讲作业

作业内容:C银行信用卡中心在对欺诈风险和反欺诈技术作了充分研究之后,融合内外部数据,建立以评分模型为支撑的欺诈识别和防范系统,以满足精细化管理的需要。本次作业根据提供的数据(“FRAUD_TRAIN_Samp.csv”,引用自陈春宝等出版的《SAS金融数据挖掘与建模》)建立信用卡申请反欺诈模型。解答步骤:1)使用决策树、神...

发表了文章 • 2018-07-02 16:56 • 0 条评论

0
推荐
967
阅读

八大直播作业-第六讲作业

作业内容: 一家婚恋网站公司希望根据已注册用户的历史相亲数据,建立新用户相亲成功可能性的预测模型,数据存放在“date_data2.csv”中解答步骤: 1)使用决策树、神经网络建立相亲成功预测模型并通过调节超参数进行模型调优,比较两个模型的优劣。2)对income,attractive,assets进行分箱(5分箱)处理,用分箱后的数据...

发表了文章 • 2018-06-23 23:36 • 0 条评论

0
推荐
1080
阅读

八大直播作业 - 第五讲作业

1. 基础知识问答:1)做了一次营销活动,营销了1000人。事后统计结果,120人购买,其余人没有购买。请分别用矩估计法、极大拟然估计发计算这个随机事件分布的参数 (提示:该随机事件服从伯努利分布)2)推导线性回归参数估计的最小二乘、矩估计、极大拟然估计,推导逻辑回归的极大拟然估计公式。线性回归和逻辑回归的极...

发表了文章 • 2018-06-16 23:27 • 0 条评论

0
推荐
1161
阅读

八大直播作业 - 第四讲作业

作业内容:研究二手房价的影响因素,建立房价预测模型,数据存放在“sndHsPr.csv”中。分析思路:在对房价的影响因素进行模型研究之前,首先对各变量进行描述性分析,以初步判断房价的影响因素,进而建立房价预测模型步骤如下:(一) 因变量分析:单位面积房价分析(二) 自变量分析:   2.1 自变量自身分布分...

发表了文章 • 2018-06-09 15:33 • 0 条评论

0
推荐
1179
阅读

八大直播作业 - 第三讲作业

使用提供的数据集作以下分析:(参考免费视频:数据科学实战:Python篇(案例:个人贷款违约预测模型)- https://edu.hellobi.com/course/270/lessons)代码路径如下:, 同样用到的预定义方法stack2dim有几点要注意:对于trans表中的balance和amount字段,由于格式不统一,要做数据整理对于issued值为2月29日的,计算一...

发表了文章 • 2018-06-02 20:09 • 0 条评论

0
推荐
969
阅读

八大直播作业 - 第一、二讲作业

作业4:使用auto_ins作如下分析1、首先对loss重新编码为1/0,有数值为1,命名为loss_flag2、对loss_flag分布情况进行描述分析3、分析是否出险和年龄、驾龄、性别、婚姻状态等变量之间的关系(提示:使用分类盒须图,堆叠柱形图)附件 HW4.py实现过程中用到了stack2dim (堆叠柱形图)代码路径为:是否出险和年龄的关系不大:...

发表了文章 • 2018-06-02 19:47 • 0 条评论