基础准备
上篇推送详细介绍了生存分析的分析理论和逻辑,接下来将会用四篇文章分别介绍SPSS生存分析菜单下的四个子菜单:寿命表分析、Kaplan-Meier分析、Cox回归、考虑具有时间依存协变量的Cox回归。上篇推送对这四种分析方法的区别和联系进行了说明,大家可以点击下方链接回顾:
今天我们先来聊聊如何用SPSS进行生存分析的Kaplan-Meier法。Kaplan-Meier法和寿命表都只能用于不考虑混杂因素(不考虑的自变量),生存时间的组间比较。例如,比较同一个疾病采取不同治疗方法以后,患者的生存时间分布情况和差异。下面我们用具体的案例来介绍Kaplan-Meier法的SPSS使用。
案例分析
生活是数据分析的来源,这也是草堂君做生活统计学公众号的初衷,因此草堂君在介绍每种数据分析方法时,都会基于案例数据的分析背景介绍一些生活常识。真所谓生活中来、生活中去,希望大家在学习的同时拓展大家的知识面。喜欢就下方点个赞,留个言吧!
肝脏是人体内新陈代谢的主要器官,同时起到去氧化、储存肝糖、合成某些蛋白质的作用。其中,肝脏的解毒功能对人体来说极其重要,例如,肝脏对来自体内和体外的许多非营养物质(各种药物、毒物以及体内某些代谢产物)都具有生物转化作用,通过新陈代谢将它们彻底分解或以原形排出体外。
肝炎是肝脏炎症的统称,多种致病因素都会导致肝炎:如病毒、细菌、寄生虫、化学毒物、药物、酒精、自身免疫因素等,它们都会使肝脏细胞受到破坏,肝脏的功能受到损害。通常我们生活中所说的肝炎,多数指的是由甲型、乙型、丙型等肝炎病毒引起的病毒性肝炎,这些类型的肝炎是具有传染性的,一旦感染,一般很难彻底清除。从事食品服务行业的朋友应该知道,在该行业从业,必须进行身体检查,获得健康证,并且健康证的有效期为一年,其中检查的重点就是肝功能。
现在有一份新型肝炎药品的的临床实验数据,随机抽取44名慢性活动性肝炎患者作为实验样本,当然为了避免其他实验以外因素的影响(混杂因素),这些患者的年龄、患病程度都相似。随机将这44名患者分成两组,每组22名,分别是新药组和对照组,新药组病人在治疗期间使用新药治疗,对照组使用常规药物治疗。
以患者到医院检查确诊患病作为生存时间起点,之后对他们进行跟踪随访,记录他们死亡发生的时间,直到研究结束。研究结束时,新药组有10名患者依旧存活,1名患者因为特殊原因删失;对照组有6名患者存活;实验数据整理成SPSS文件如下,生存时间的记录单位是月;样本状态代表样本在研究期间的最终结果是死亡、删失还是存活;组别分为两组:新药组和对照组。
(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)
分析步骤
1、选择菜单【分析】-【生存分析】-【Kaplan-Meier】,将生存时间选为时间;将样本状态选为状态,定义事件选择数值0,因为将患者死亡定义为事件发生;因子选择组别,因为该案例研究的是新药组和对照组的生存时间分布差别。
2、点击【比较因子】按钮,将所有检验统计都选中,它们的作用是检验新药组和对照组的时间分布情况是否有差异。三种检验方法的差别是在各时点所取的权重不同:1、秩的对数在各时点的权重均为1;布雷斯洛在各时点的权重等于各时点前的尚存人数;塔罗内-韦尔在各时点的权重等于各时点前的尚存人数的平方根。
对于开始粘在一起,随着时间的推移越拉越开的生存曲线,秩的对数比布雷斯洛更容易得到有显著性差异的结果;对于开始相差很大,随着时间的推移越来越接近的生存曲线,布雷斯洛法更容易得到显著性差异结果;塔罗内-韦尔法的作用则在两者中间。
3、点击【选项】按钮,将生存分析表和平均值和中位数生存分析函数选中;再选中生存分析函数图。大家也可以根据自己的需求选择。
结果解释
1、个案摘要表;从表中可知,新药组在研究期间,死亡人数为11人,而对照组是16人。需要注意,这里的检剔后的个案数包括删失和最终存活两类。
2、生存分析表;结果会输出新药组和对照组的生存分析表,这里仅以新药组为例进行说明。所有22名患者按照生存时间由大到小进行排列,估计列的内容是依旧存活的病人比例,也就是生存概率。
3、两个组的生存时间的集中趋势和离散程度;可见新药组的平均生存时间(125.264)比对照组(72.545)大很多。
4、差异显著性检验结果;从下方结果可知,三种差异显著性检验结果的p值都小于0.05,说明新药组和对照组的生存时间分布情况具有显著性差异。
5、生存函数曲线;从生存函数曲线可以直观看出,新药组的曲线在对照组上方,说明新药对于肝炎的治疗效果对比传统疗法有显著性提高。
所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。
温馨提示: