交叉验证属于模型选择还是模型评价?

0
在机器学习中对一个数据集表示成设计矩阵的形式,(行表示样本,列表示特征)必须是可以将每一个样本表示成向量,并且这些向量大小相同,但是并非永远可以做到这一点,对于长度不同的样本,是否可以通过补零的方式,使得每个数据集相同,从而构造设计矩阵,这对原始数据集是否有影响,如果有,有多大影响,为什么?求大神给解释一下
已邀请:
0

浩彬老撕 - 数据分析/数据挖掘专家,目前任职于IBM认知计算部门,曾担任SPSS技术工程师,现在负责IBM预测性客户智能方案。 2017-01-14 回答

貌似问题和描述不太一致?
应该说交叉验证可以用于模型选择和模型评价。另外模型选择和模型评价本身就不是割裂开的问题,如果不能进行模型评价那么如何选择模型?
再回答描述的,这种情况不就是等同于缺失值嘛。一般来说我们可以通过一些算法进行空值插补,当然缺失比例太大的话可能就会删除

要回复问题请先登录注册