切比雪夫不等式

基本比率谬误是我们常犯的认知错误,下面重新来研究一下怎么对付它。

1 条件概率

回忆下之前的问题,已知某种疾病在人群中有的患病率,可以通过某种手段来检测这种疾病,这种手段有的正确率。那么如果被检测出有病,真正有病的比率是多少?

这个问题之前已经解决了,首先,已知的是“这种手段有的正确率”:

据此,求出“被诊断出有病了之后真的有病的概率”为:

我们的样本空间是10000人,而这里两个概率:

分母都不到10000人,所以它们都是局部概率,也就说都是条件概率。

先来定义两个事件:

的正确率”指的是,患病的条件下,检测显示有病,即:

要求的“被诊断出有病了之后真的有病的概率”指的是,检测有病的条件下,真的患病,即:

通过韦恩图可以看出为(这个韦恩图画在这里不算标准,大家主要理解意思):

所以:

2 贝叶斯定理

通过上面的分析知道了,条件给出的是,要求的是

那这就是简单的乘法问题了:

这就是

对于同一样本空间中的随机事件,若,有:

3 贝叶斯定理的解读

在诊断问题中,已知检测的正确率有,或者说确诊率为

而求出来的“被诊断出有病了之后真的有病的概率”为:

之前说过,差别这么大在于基本比率悬殊,也就是所有人中患者只占了,贝叶斯定理正好反映了这点:

是关于所有人的概率:

两者的比例就是所谓的基本比率。

练习题 刚才已经知道了,通过这种手段检测出有病后,真正患病的概率只有,这个概率太低了。

现实中,我们会对检测出有病的人群进行复查,复查后如果依然显示有病,那么真正患病的概率为多少?

复查是针对第一次检测出有病的人进行的,在这群人里面患病的概率为,也就是此时和所有人时不一样了:

对第一次检测出有病的人再进行检测的话,其中有 15.5% 是真正有病的,这里面 90% 还会被检测为有病;另外 84.5 % 是没病的,其中 10% 的人会被检测为有病,所以:

代入公式可得:

现在正确率大大提高了,还不放心可以再复查一次:

关注马同学
马同学高等数学
微信公众号:matongxue314