我想问一下,如果不懂算法源代码,不懂怎么修改算法,在建模的时候,建模预测比较准,但用来预测就不准了,这个是什么原因,比如用随机森林预测,怎么去调优模型呢?

0
已邀请:
0

浩彬老撕 - 数据分析/数据挖掘专家,目前任职于IBM认知计算部门,曾担任SPSS技术工程师,现在负责IBM预测性客户智能方案。 2016-07-24 回答

这应该属于过拟合问题了。实际上,模型越复杂,出现“过拟合”的可能性就越大,因此一般而言,我们更喜欢“简单”的模型,而这种思想确实又与众所周知的“奥卡姆剃刀原理”是不谋而合的。“奥卡姆剃刀原理”是有14世纪逻辑学家奥卡姆的威廉所提出,简单来说就是“如无必要,勿增实体”。而放在统计学习领域里面,我们则可以翻译为“若有两个预测能力相当的模型时,我们应该选择其中较为简单的一个”。
直接点说,楼主的模型预测是否有划分训练集与测试集?该模型在测试集的预测能力如何?
如果没有划分训练集与测试集,建议使用测试集选择模型。
如果在测试集训练效果很好在实际也很差的话,可能是由于数据样本的选取问题了。

要回复问题请先登录注册