SPSS分析技术:生存分析的寿命表法;聊聊寿命表法与Kaplan-Meier法的区别与联系

浏览: 5753

基础回顾

前面推送了生存分析的基本理论及Kaplan-Meier法的使用过程:

今天要介绍利用寿命表进行生存分析。上面的文章中介绍过Kaplan-Meier法和寿命表都能用于分析单个因素不同水平之间的生存时间分布比较。虽然Kaplan-Meier法是更为常用的分析方法,但是它也有缺陷,需要准确记录事件和删失的发生时点。

 

某些事件的发生和删失是没有外在表现的,特别是某些慢性疾病,需要定期检查才能得知事件有没有发生。例如,定义事件为癌症复发,复发发生的时点往往无法及时发现并准确记录发生时间,通常的做法是通过定期检查身体来追踪是否复发,这时记录的生存时间为时段数据,这时采用寿命表法更加合适。

案例分析

生活是数据分析的来源,这也是草堂君做生活统计学公众号的初衷,因此草堂君在介绍每种数据分析方法时,都会基于案例数据的分析背景介绍一些生活常识。真所谓生活中来、生活中去,希望大家在学习的同时拓展大家的知识面。喜欢就下方点个赞,留个言吧!

癌症泛指所有的恶性肿瘤,是由癌细胞引起的严重疾病,致死率极高。癌细胞是一种变异的细胞,是产生癌症的病源,癌细胞与正常细胞的不同之处在于其有无限增殖的能力,而且还会局部侵入周遭正常组织甚至经由体内循环系统或淋巴系统转移到身体其他部位。癌细胞的无限增殖会破坏正常的细胞组织,导致出血、坏死、溃疡,造成人体消瘦、无力、贫血、食欲不振、发热以及严重的脏器功能受损等,最终造成患者死亡。随着人类平均寿命的延长,癌症对人类的威胁越来越大,已经成为我国城乡居民的最主要死因。引起癌症的因素通常有不良的生活习惯(吸烟、喝酒、污染水和霉变食品等);生活环境(接触有毒化学物质等);生物因素(真菌病毒等)等这些有害因素。大家在生活中需要注意。

 

现在有一份来自某医院的数据,对114名男性胃癌患者接受手术后的生存情况进行了为期11年的随访,得到他们的生存时间数据,整理成SPSS数据如下。可以发现,由于术后癌症的复发不易察觉,这些病人每年会回医院定期复诊,以确定癌症是否复发,因此这里的生存时间是以年为单位计数的,至于具体的发病时间无法确定。适用寿命表法进行生存分析。

image.png

(例题数据文件已经上传到QQ群中,需要的朋友可以前往下载)

分析步骤

1、由于数据已经进行过频数加和,形成的变量是人数,因此需要先对数据进行个案加权,选择菜单【数据】-【个案加权】,将人数变量作为加权变量。具体操作过程请参考文章:SPSS分析技术:加权个案;让频数记录数据也能用SPSS做列联表分析

2、选择菜单【分析】-【生存分析】-【寿命表】,将术后年数选入时间;时间间隔填写0~10,表示研究周期是11年(数值10代表生存时间在10年到11年之间),按1表示术后年数每增加1,记录一次病人的生存状态。将生存状态选入状态,定义事件填写1,表示病人癌症复发是事件发生。

image.png

3、点击【选项】,选中寿命表;输出图选择生存分析图,也可以根据需要选择其他的图形,比如风险图,累积风险图等等。

image.png

4、点击确定,输出结果。

结果解释

1、寿命表;这里需要强调,第一列的时间,0表示0~1年,1表示1~2年,是指事件发生在一年的时间间隔内。在表格的左下角显示,跟踪的114名癌症术后病人,他们的生存时间中位数为5.74年。

image.png

以0~1年组为例,结果显示在0~1年进行研究的术后癌症病人共有114例,其中有5例在这一年中删失,因为不知道具体的删失时间点,所以只能假设它们均只观察半年,算作0.5个病人,因此暴露在癌症复发风险中的总人数减少为114-5/2=111.5。在0~1年时间段,有三人复发,因此复发率(终止比例)的估计值为3/111.5=0.0269;其它指标的含义如下:

时间间隔开始时间:寿命表记录生存时间段的下限,例如0表示0~1年;

进入时间间隔的数目:活到该时间段下限的人数,例如106表示有106人活过1年;

时间间隔内撤销的数目:该时间段内删失的人数,例如5表示有5人在0~1年时间内失去联系;

有风险的数目:表示有效观察人数或校正人数;等于进入该时间段的观察人数减去删失人数的一半,例如111.5=114-5/2。

终端事件数:出现所关心事件的人数,即癌症复发人数,例如在0~1年内,有3人复发。

终止比例:出现癌症复发的患者比例,即每个时间段内的复发概率,例如,0.03=3/111.5。

生存分析比例:每个时间段内的生存概率,等于1-复发概率(终止比例),例如0.97=1-0.03。

期末累积生存分析比例:至本时间段上限的生存函数估计值,由之前时间段的生存分析比例相乘,例如0.89=0.97*0.91。

概率密度:所有进入实验的病人在时点t后,单位时间内死亡概率的估计值。

风险率:活过时点t的癌症病人,在时点t后,单位时间内死亡概率的估计值。

2、生存分析函数图;

image.png

总结一下

从以上结果可知,寿命表法与Kaplan-Meier法相比只是将期间删失的人数算作半个人数,或者说算作在期中发生死亡事件,其它没有差异。

所有例题的数据文件都会上传到QQ群中,需要对照练习的朋友可以前往下载,QQ群号见下方温馨提示。生活统计学不仅有各种数据分析方法,更有容易被大家忽视的生活常识。

温馨提示:

  • 生活统计学QQ群:134373751,用于分享文章提到的各种案例资料、软件、数据文件等。支持各种资料的直接下载和百度云盘下载。

  • 生活统计学微信交流群,用于各自行业的数据研究项目及其成果交流分享;由于人数大于100人,请添加微信possitive2,拉您入群。

  • 数据分析咨询,请点击首页下方“互动咨询”板块,获取咨询流程!

  • 数据分析课程私人定制,一对一辅导,添加微信(possitive2)咨询!

推荐 0
本文由 老谢 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册