请问从总体中抽取一部分样本建逻辑回归模型,从样本划分的测试集中确定阈值和该阈值在测试集的预测NPS,将模型和阈值运用到总体中,得到的总体NPS和测试集的NPS差异很大,可能是什么原因造成

0
已邀请:
0

结实 - 始终在寻找数据的落脚点与发光点。还好,让我赶上了这个大数据时代,感恩中前行~!在工作中学习,在学习中分享,在分享中传递,在传递中提升。come on。我是结实,我来了。 2018-03-26 回答

1,总体和样本的数据量级差距大;
2,总体和样本各自的正反例相差比重相差很大;
3,样本的抽样规则是否符合业务(随机抽样还是分层抽样还是其他.....)
 

要回复问题请先登录注册