基础准备
前面介绍了混合线性模型的理论基础:数据分析技术:混合线性模型;如何通过模型预测不同学校,不同基础学生的中考成绩?(需要回顾的朋友可以点击蓝字回顾)
我们学习方差分析时,接触过包含以下这些因素(自变量)类型的方差分析:固定因素、随机因素和协变量。回顾可以从SPSS分析技术(导航页)找到相应文章回顾。介绍包含以上这些因素(自变量)类型的方差分析时,都是独立单一介绍它们的,如果在一个数据分析情景中,这些因素(自变量)都包含,那么该方差分析模型被称为混合效应模型。今天我们用一个具体的案例来说明混合效应模型的基础类型:混合线性模型。
案例及模型介绍
前面介绍混合线性模型时,我们采用的数据集是混合效应模型的经典研究数据集《初等中学学生数据》,总共包括4059名初中学生的信息数据,数据集包含以下变量:
学校编号:学生所在学校的代码,取值为1~65。
学生座号:每个学生在学校内的座号。
中考成绩:学生在中考时的考试成绩,已进行了标准正态变换。
入学成绩:学生在入学时的考试成绩,已进行了标准正态变换。
学生性别:学生的性别。
学校类型:学校的类型,1代表男女混合,2代表男校,3代表女校。
平均成绩:各个学校的学生入学成绩的平均值,已进行了标准正态变换。
在混合线性模型的理论基础文章:,我们假设现在要以入学成绩为自变量,建立学生中考成绩的回归方差,同时考虑学校因素。在该模型中,入学成绩是协变量,学校是因素。在理论基础文章中,我们介绍了,如果学校因素被设定为不同的因素类型,那么分析模型也会有很大的不同。如果只考虑一所学校,那么中考成绩的回归模型可以表示为:
如果只考虑少数几个学生的学生,那么学校因素就是固定因素,回归模型表示为:
如果不仅考虑少数几个学校,还要扩展到其它学校,那么学校因素就是随机因素,回归模型则变为:
最后回归模型可以整理成以下形式:
前面部分是固定部分,也就是固定因素(协变量)对中考成绩的影响。后面部分为随机部分,也就是随机因素、随机误差等对中考成绩的影响。
如果大家对以上模型变化有不理解的,可以回顾理论部分的介绍:数据分析技术:混合线性模型;如何通过模型预测不同学校,不同基础学生的中考成绩?
案例分析
数据集《初等中学学生数据》的情况如下图所示:
(例题数据文件已经上传到QQ群,群号请见文章底部温馨提示)
分析思路
通过SPSS的操作,对我们前面设计的模型进行检验。我们设计的模型可以表示为下面的形式:
分析步骤
1、选择菜单【分析】-【混合模型】-【线性】,跳出线性混合模型对话框,如下图所示。因为我们希望模型不仅能用于数据集中的这些学校,还能扩张到其它学校,所以学校因素是随机因素,将学校选入主体框中,点击继续。
2、点击继续以后,跳出下面的线性混合模型对话框。将中考成绩选为因变量;入学成绩选为协变量。
3、对固定效应和随机效应进行设定。点击固定按钮,将左边两入学成绩选入模型对话框,再将包括截距选中,点击确定。
然后在点击随机按钮,对随机效应进行设定,选中包括截距,将协变量入学成绩选入模型框,然后再将学校选入组合框中,点击继续。
4、设定完成后,点击确定,输出结果。
结果解释
1、模型描述对话框;
模型描述对话框,它描述的模型和前面我们设计的中考成绩回归模型是一样的。下面是我们前面设计的模型。
2、固定效应参数的检验结果。
前面设计的模型的固定效应为:
截距a0的显著性为0.841,说明接受原假设,也就是说不能拒绝所有学校的成绩平均水平为0的假设。入学成绩的显著性等于0.000,说明入学成绩确实会对中考成绩有影响。以上结论说明模型的固定效应是成立的。
3、随机效应参数的检验结果。
随机效应的组成参数为:
从分析结果来看,这三部分的显著性都小于0.01,说明它们对于中考成绩的影响也是显著的。其中入学成绩[主题=学校编号]代表入学成绩对学生进入学校以后的表现有很重要的影响,最终会导致中考成绩出现差异,这也就是说学校越好,入学成绩越高,两者会起到加成作用,最终表现为中考成绩越高。
以上我们混合线性模型简单介绍,大家可以根据上面介绍的模型设计过程和数据分析方法继续引入其他的固定因素和随机因素,使得模型得到进一步的优化。《初等中学学生数据》数据集还有学校类型和学生性别这两个固定因素,大家可以引入到混合线性模型中,继续优化模型,使得对中考成绩的预测更加准确。