交叉验证属于模型选择还是模型评价?
0
在机器学习中对一个数据集表示成设计矩阵的形式,(行表示样本,列表示特征)必须是可以将每一个样本表示成向量,并且这些向量大小相同,但是并非永远可以做到这一点,对于长度不同的样本,是否可以通过补零的方式,使得每个数据集相同,从而构造设计矩阵,这对原始数据集是否有影响,如果有,有多大影响,为什么?求大神给解释一下
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
浩彬老撕 - 数据分析/数据挖掘专家,目前任职于IBM认知计算部门,曾担任SPSS技术工程师,现在负责IBM预测性客户智能方案。 2017-01-14 回答
赞同来自:
应该说交叉验证可以用于模型选择和模型评价。另外模型选择和模型评价本身就不是割裂开的问题,如果不能进行模型评价那么如何选择模型?
再回答描述的,这种情况不就是等同于缺失值嘛。一般来说我们可以通过一些算法进行空值插补,当然缺失比例太大的话可能就会删除