SPSS分析技术：混合效应模型；儿童牙齿发育的混合效应模型的建立

发表: 2017-04-18 浏览: 13400

儿童牙齿混合效应模型 SPSS

基础准备

前面我们介绍的均值比较方法，从简单的Z检验、T检验，到方差分析，基本上都会有数据的独立性、正态性和方差齐性的要求，其中数据的独立性要求是最严格的。虽然数据的独立性很好理解，但是往往在不经意间发现采集的数据在某些角度上是非独立性的，混合效应模型就是专门用于非独立数据的统计分析的。

前面介绍了很多的方差分析方法，我们可以简要的进行分类，主要可以从三个维度进行分类：处理因素的数目、因变量数目和实验设计方法。其中实验设计方法的目的主要是为了数据分析的要求，排除很多非处理因素的影响。

在SPSS中为各种方差分析方法都提供了专门的模块，可以方便大家进行数据分析，但是某些时候，数据分析所涉及或考虑的自变量种类很多（包括分类因素和协变量），数据之间并不是完全独立的，在某些因素上表现出层次聚集性，那么SPSS提供的这些单独的模块在此时就表现得有些力不从心了。此时可以使用混合效应模型。

混合效应模型可以看做是上面这些方差分析模型的集合体，上面这些方差分析模型则可以看做是混合效应模型的特例。我们可以列举两个例子：单因素方差分析模型：等价于只考虑一个固定因素时混合效应模型的结果；方差分析模型：等价于无重复测量且所有随机效应被限定为等方差时的混合效应模型。

混合效应模型的使用

现在有一份某医院的牙科数据，需要分析青少年牙齿发育的情况与年龄和性别之间的关系。该数据包括27名随机选择的儿童，分别在他们8岁、10岁、12岁和14岁时测量他们垂体中心到上颌骨裂隙间的距离。数据存储在SPSS文件中，如下图所示：

（例题数据文件已经上传到QQ群，群号请见文章底部温馨提示）

案例分析

需要分析的青少年的牙齿发育情况与年龄和性别之间的关系，也就是要分析该牙科指标（距离）是否随着年龄的增大有所变化，不同性别的儿童距离是否有差异。我们可以先做个折线图观察该指标与年龄和性别的关系，如下图所示：

从图中可以得到以下信息：

男孩和女孩在该项牙科指标上是有差异的，且男孩比女孩的指标数值更大。
从整体来看，随着年龄的增长，距离是逐渐增大的。

从折线图结果来说，该指标确实与年龄和性别有关。年龄和性别是分类变量，可以使用两因素方差分析模型进行分析。然而，在折线图中，我们还可以观察到不同儿童（个体）的4个年龄的距离数据还是有很大差异的，折线的位置有高有低，这说明距离数据在儿童（个体）这个角度上有层次聚集性，也就是说数据不是完全独立的。为了验证我们的观察，可以先用【一般线性模型】-【单变量】模块对性别、年龄和个体这三个因素对齿科指标的影响进行分析。直接给出分析结果：

从分析结果可知，我们原先的设想是正确的，齿科指标（距离）在性别、年龄和个体上都表现出显著性差异。因此我们可以将这三个因素建立混合效应模型。初步的，我们可以写出下面的回归模型：

模型写好以后，需要对每个因子进行属性定义。

因为我们要分析的是性别和年龄对牙齿距离的影响，所以个体差异我们作为层次聚集因素处理。此外，模型的建立不仅是希望在这27名儿童中适用，也希望扩展到其它的儿童中，因此在模型作为随机因素处理。
性别是分类变量，是明确的固定因素。
年龄因素可以作为协变量（连续型变量）处理。
因为每个儿童被测量了4次，所以数据是重复测量的，4次测量的数据之间有相关性。

经过定义，上面的回归模型可以写成下面的形式：

分析步骤

1、选择菜单【分析】-【混合模型】-【线性】。跳出导航页需要填写主体和重复项。因为本案例的数据在个体上具有聚集效应，所以主体中选择个体，即儿童编号；此外，每个个体在8,10,12,14岁时重复测量，所以将年龄选入重复框内；将重复协方差矩阵选为标度恒等，也就是假设每次测量的方差相等，这是我们的假设，也可以根据实际情况选择其他方差类型。