数据挖掘

我想问一下，如果不懂算法源代码，不懂怎么修改算法，在建模的时候，建模预测比较准，但用来预测就不准了，这个是什么原因，比如用随机森林预测，怎么去调优模型呢？

0

重要提示：提问者不能发表回复，可以通过评论与回答者沟通，沟通后可以通过编辑功能完善问题描述，以便后续其他人能够更容易理解问题.

1 个回复

0

浩彬老撕 - 数据分析/数据挖掘专家，目前任职于IBM认知计算部门，曾担任SPSS技术工程师，现在负责IBM预测性客户智能方案。 2016-07-24 回答

这应该属于过拟合问题了。实际上，模型越复杂，出现“过拟合”的可能性就越大，因此一般而言，我们更喜欢“简单”的模型，而这种思想确实又与众所周知的“奥卡姆剃刀原理”是不谋而合的。“奥卡姆剃刀原理”是有14世纪逻辑学家奥卡姆的威廉所提出，简单来说就是“如无必要，勿增实体”。而放在统计学习领域里面，我们则可以翻译为“若有两个预测能力相当的模型时，我们应该选择其中较为简单的一个”。
直接点说，楼主的模型预测是否有划分训练集与测试集？该模型在测试集的预测能力如何？
如果没有划分训练集与测试集，建议使用测试集选择模型。
如果在测试集训练效果很好在实际也很差的话，可能是由于数据样本的选取问题了。

要回复问题请先登录或注册

我想问一下，如果不懂算法源代码，不懂怎么修改算法，在建模的时候，建模预测比较准，但用来预测就不准了，这个是什么原因，比如用随机森林预测，怎么去调优模型呢？

1 个回复

发起人

相关问题

问题状态

我想问一下，如果不懂算法源代码，不懂怎么修改算法，在建模的时候，建模预测比较准，但用来预测就不准了，这个是什么原因，比如用随机森林预测，怎么去调优模型呢？

与内容相关的链接

1 个回复

发起人

相关问题

问题状态