关于数据成绩的问题,遇以下问题
0
数据中包括39个指标,有每章看视频的时间和相对的章节成绩总成绩等一下相关的指标吧,我思路是这样的:先做个相关分析,然后根据相关系数找出其中几个和最终成绩关系大的具体分析,然后做一个回归,主成分啥的。进行预测,这是我目前的想法,还有其他的聚类呀,分类的或许会涉及,但是能力还不够。若老师有好的方法思路请多指教!!谢谢
我目前在相关系数表里面39X39 的矩阵 太多了我都不知道怎么办。希望老师指点迷津,谢谢
我目前在相关系数表里面39X39 的矩阵 太多了我都不知道怎么办。希望老师指点迷津,谢谢
没有找到相关结果
重要提示:提问者不能发表回复,可以通过评论与回答者沟通,沟通后可以通过编辑功能完善问题描述,以便后续其他人能够更容易理解问题.
1 个回复
marxsong 2016-12-21 回答
赞同来自: MarsJ
1、最终成绩是什么变量,是等级的还是连续型的?
2、各指标的数据类型?
3、做模型的时候是否需要归一化?
4、之前涉及到一个变量选择问题,可以参照一些方法;
5、可以用多元回归模型,如用step函数进行模型选择;
6、另外,如果是对最终成绩进行预测,也可以使用回归树模型、神经网络模型、随机森林等等