SPSS分析技术:Cox回归分析

浏览: 2683

基础准备

前面介绍生存分析的理论基础,Kaplan-Meier法和寿命表法,如果这些内容都还不是非常熟悉的朋友,可以点击下面的链接回顾:

其中,Kaplan-Meier法和寿命表法只能针对单个因素不同水平的生存时间分布的差异做出显著性差异,如果需要考虑的自变量有多个,那么这两种方法就无能为力了,此时需要使用Cox回归进行分析。


Cox回归分析

从Kaplan-Meier和寿命法的推送文章中可以知道,这两种生存分析得到的结果其实是生存时间的概率分布,即不同生存时间点,事件发生的概率。例如,生存分析应用于医学领域,分析结果就是不同时间点,患者疾病复发或死亡(事件发生)的概率分布。这些概率分布情况可以用生存函数、风险函数等来表示。

生存函数和风险函数在生存分析中往往不是一定需要求得的,很多情况只需输出生存曲线和比较不同类型群体生存曲线的差异即可,因此SPSS生存分析菜单并没有这些函数输出选项,因此这些菜单被称为非参数法(Kaplan-Meier法和寿命表法)和半参数法(Cox回归)。

Cox回归是一种半参数方法,它的基本思想是将风险函数与研究自变量之间建立函数关联,这样就可以直接考察研究自变量对风险函数的影响效果。对风险函数的概念不理解的可以点击下面文章回顾:数据分析技术:生存分析;生存分析起于医学研究,却不囿于医学研究

image.png

从公式可以看出,如果自变量有n个,每个自变量前面都会有回归系数。回归系数可以这样解释,在其它自变量固定的情况下,x1的取值增加一个单位,则Cox回归函数h(X,t)变为原来的exp(a1)倍,这就是通常所说的相对风险比,因此回归系数反映相应自变量对风险函数的影响效果。如果回归系数是正数,则相应的自变量具有增加风险的效果,反之,则有具有降低风险的效果。因为前面的风险函数不需要求解,只需求得后面的线性方程,因此Cox回归模型也被称为半参数生存分析法。

如果有患有同一种疾病的两个人A和B,已知该疾病的风险函数(死亡风险)为h(t),两个病人的Cox回归模型之比的公式如下:

image.png

上式表示在时点t时,病人A相对于病人B的死亡风险。从公式还可以知道,两个病人的风险比不随时间的变化而变化,这称为Cox回归模型的比例风险性。也是因为这个性质,Cox回归模型也被称为比例风险模型。

因此在使用Cox回归模型进行分析时,需要注意自变量对风险函数的影响是否会随时间的变化而变化,如果会,那就不能直接使用Cox回归模型,而应该使用考虑随时间变化自变量的Cox回归模型。

案例分析

胰腺癌是一种恶性程度很高,诊断和治疗都很困难的消化道恶性肿瘤,早期的确诊率不高,手术死亡率仍然较高,而治愈率很低。胰腺癌的病因尚不十分清楚。慢性胰腺炎和糖尿病可能和胰腺癌的发生有一定关系。

某医院跟踪收集了83位胰腺癌术后患者的数据,数据中包括生存时间、生存状态、手术时年龄、是否放疗、性别、病灶位置、胰胆管浸润程度、是否腹膜转移、癌症时期等变量。通过Cox回归模型,分析这些自变量对胰腺癌术后患者生存时间的影响。数据整理如下:

image.png

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)

分析步骤

1、选择菜单【分析】-【生存分析】-【Cox回归】,将生存时间选入时间框内;将生存状态选入状态框,并定义死亡为事件发生;将其余的变量都选入自变量框;自变量输入的方式选择输入。这里需要注意,自变量进入模型的方式也可以选择向前或向后,这部分内容和逻辑回归的内容是一样的,大家可以参考逻辑回归文章回顾:SPSS分析技术:逻辑回归中自变量的筛选方法;筛选方法不同,结果完全两样!

image.png

2、点击【分类】按钮,将分类型自变量做哑变量处理,将所有分类型自变量选入右边方框内,至于哑变量的设置选项参考逻辑回归的文章,这里选择默认的指示符,将每个分类自变量的最后一项作为参考类别。

image.png

3、点击【图形】按钮,选中生存分析。因为从分析结果可知,是否放疗对生存函数的影响是显著的,因此这里只将是否放疗选中,输出是否放疗两个类型的生存曲线。

image.png

4、点击【确定】,输出结果。

结果解释

1、个案处理摘要;从结果可知,有83个胰腺癌术后病人中,有82人都先后死亡,死亡率非常高,只有1个病人在活过了本次研究的研究期。

image.png

2、初始模型的-2对数似然数。可以通俗的理解,该数值表示不纳入任何自变量时,数据的混乱程度,如果纳入自变量后,新模型的-2对数似然数减小,并通过假设检验显示新模型与旧模型之间有显著性差异,代表纳入的自变量是有效的,在新模型下,数据变异能够被纳入的自变量所解释。

image.png

3、新模型的-2对数似然数。可以发现新模型的-2对数似然数为552.313,比原来没有纳入自变量的Cox回归模型的570.430减小18.280,显著性为0.032,小于0.05,说明纳入自变量后的新模型比旧模型的解释能力更强,并且是显著性的强。

image.png

4、回归系数表;在所有纳入的自变量中,只有是否手术中化疗这个自变量的显著性小于0.05,说明是否术中化疗显著影响病人术后的生存时间分布。

image.png

是否术中化疗的回归系数为0.818,是正值,表示术中化疗能够降低术后患者的死亡风险。根据前面介绍的Cox回归模型,其对风险函数的影响效果应该为exp(0.818)=0.441,表示在不考虑其它自变量的影响下,在研究期间的任何一个时间点,接受术中化疗的术后患者,其死亡风险是未接受患者的0.441倍,也就是死亡风险降低一半以上。

其它自变量的显著性小于0.05,可以再次拟合Cox回归模型,采用变量筛选的方式建立新的Cox回归模型。大家会发现,剔除部分自变量后,-2对数似然值可能比上面模型的值增大了,这也是正常的,因为虽然有些自变量对风险函数的影响不显著,但是还是会解释一部分变量变异的,大家根据实际情况选择即可。

5、生存曲线;左图是按自变量平均值的生存分析函数曲线,表示所有自变量取均值的情况下,生存概率的变化情况,从曲线可知,研究人群只有10%的个体存活时间在一年以上。

image.png

右图是将是否术后治疗自变量的两个水平分开,将其它自变量的影响效应固定(取值为0),做出的两条生存函数曲线,从曲线也可以看出,进行术中化疗的患者,他们的生存时间分布普遍高于没有进行术中化疗的患者。

所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。

温馨提示:

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册