关于数据成绩的问题,遇以下问题

0
数据中包括39个指标,有每章看视频的时间和相对的章节成绩总成绩等一下相关的指标吧,我思路是这样的:先做个相关分析,然后根据相关系数找出其中几个和最终成绩关系大的具体分析,然后做一个回归,主成分啥的。进行预测,这是我目前的想法,还有其他的聚类呀,分类的或许会涉及,但是能力还不够。若老师有好的方法思路请多指教!!谢谢
   我目前在相关系数表里面39X39 的矩阵 太多了我都不知道怎么办。希望老师指点迷津,谢谢
已邀请:
1

marxsong 2016-12-21 回答

有几个问题需要明确一下:
1、最终成绩是什么变量,是等级的还是连续型的?
2、各指标的数据类型?
3、做模型的时候是否需要归一化?
4、之前涉及到一个变量选择问题,可以参照一些方法;
5、可以用多元回归模型,如用step函数进行模型选择;
6、另外,如果是对最终成绩进行预测,也可以使用回归树模型、神经网络模型、随机森林等等

要回复问题请先登录注册