前面我科普了贝叶斯的以下内容:
1.贝叶斯定理有什么用?
2.什么是贝叶斯定理?
3. 如何应用贝叶斯定理解决实际问题
今天我们来看贝叶斯的第2个应用案例。
1 什么是假阳性?
每一个医学检测,都存在假阳性率和假阴性率。所谓假阳性,就是没病,但是检测结果显示有病。假阴性正好相反,有病但是检测结果正常。
假设检测准备率是99%,如果医生完全依赖检测结果,也会误诊,即假阳性的情况,也就是说根据检测结果显示有病,但是你实际并没有得病。
举个更具体的例子,因为艾滋病潜伏期很长,所以即便感染了也可能在相当长的一段时间身体没有任何感觉,所以艾滋病检测的假阳性会导致被测人非常大的心理压力。
你可能会觉得,检测准确率都99%了,误测几乎可以忽略不计了吧?所以你觉得这人肯定没有患艾滋病了对不对?
但我们用贝叶斯分析算一下,你会发现你的直觉是错误的。
2 违反直觉的贝叶斯
假设某种疾病的发病率是0.001,即1000人中会有1个人得病。现有一种试剂可以检验患者是否得病,它的准确率是0.99,即在患者确实得病的情况下,它有99%的可能呈现阳性。它的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性。现有一个病人的检验结果为阳性,请问他确实得病的可能性有多大?
好了,我知道你面对这一大推信息又头大了,我也是。但是我们有模板套路,下面开始。
第1步,分解问题
1)要求解的问题:病人的检验结果为阳性,他确实得病的概率有多大?
病人的检验结果为阳性(新的信息)为事件B,他得病记为事件A,
那么求解的就是P(A|B),即病人的检验结果为阳性,他确实得病的概率
2)已知信息
疾病的发病率是0.001,即P(A)=0.001
试剂可以检验患者是否得病,准确率是0.99,即在患者确实得病的情况下(A),它有99%的可能呈现阳性(B),
也就是P(B|A)=0.99
试剂的误报率是5%,即在患者没有得病的情况下,它有5%的可能呈现阳性
得病我们记为事件A,那么没有得病就是事件A的反面,记为A',所以这句话就是P(B|A')=5%
第2步,应用贝叶斯定理
1)求先验概率
疾病的发病率是0.001,即P(A)=0.001
2)求可能性函数
P(B|A)/P(B)
其中,P(B|A)表示在患者确实得病的情况下(A),试剂呈现阳性的概率,从前面的已知条件中我们已经知道P(B|A)=0.99
现在只有求出P(B)就可以得到答案。根据全概率公式,可以求得P(B)=0.05如下图:
所以可能性函数P(B|A)/P(B)=0.99/0.05=19.8
3)带入贝叶斯公式求后验概率
我们得到了一个惊人的结果,P(A|B)等于1.98%。
也就是说,虽然筛查的正确性都到了99%以上了,通过体检判断有没有得病的概率也只有1.98%
3 应该相信筛查结果吗?
你可能会说,再也不相信那些吹的天花乱坠的技术了,说好了筛查准确率那么高,结果筛查的结果对于确诊疾病一点用都没有,这还要医学技术干什么?
没错,这就是贝叶斯分析告诉我们的。
我们拿艾滋病来说,由于发艾滋病实在是小概率事件,所以当我们对一大群人做艾滋病筛查时,虽说准确率有99%,但仍然会有相当一部分人因为误测而被诊断为艾滋病,这一部分人在人群中的数目甚至比真正艾滋病患者的数目还要高。
你肯定要问了,那该怎样纠正测量带来这么高的误诊呢?
造成这么不靠谱的误诊的原因,是我们无差别地给一大群人做筛查,而不论测量准确率有多高,因为正常人的数目远大于实际的患者,所以误测造成的干扰就非常大了。
根据贝叶斯定理,我们知道提高先验概率,可以有效的提高后验概率。
所以解决的办法倒也很简单,就是先锁定可疑的样本,比如10000人中检查出现问题的那10个人,再独立重复检测一次,因为正常人连续两次体检都出现误测的概率极低,这时筛选出真正患者的准确率就很高了。
这也是为什么艾滋病检测第一次呈阳性的人,还需要做第二次检测,第二次依然是阳性的还需要送交国家实验室做第三次检测。
在《医学的真相》这本书里举了个例子,假设检测艾滋病毒,对于每一个呈阳性的检测结果,只有50%的概率能证明这位患者确实感染了病毒。但是如果医生具备先验知识,先筛选出一些高风险的病人,然后再让这些病人进行艾滋病检查,检查的准确率就能提升到95%。
推荐阅读:测一测你是不是险盲?