泊松分布(上)

1 泊松分布的定义
定义 1.为:

则称服从参数为 泊松分布 (Poisson distribution),记作

泊松分布由法国数学家西蒙·德尼·泊松(Siméon Denis Poisson,1781-1840,图 1 )于1837年提出。但直到19世纪末,俄国数学家拉迪斯劳斯·博特基维奇(Ladislaus Bortkiewicz)利用它研究普鲁士军人被马踢致死(图 2 )的数据后,这一分布才广受关注。

图 1 西蒙·德尼·泊松(1781-1840)

图 2 普鲁士军队的士兵被马踢

下面用通俗的语言来讲述普鲁士军人被马踢致死的研究,以揭示泊松分布的意义。假设普鲁士某军团有1000名士兵,每名士兵被马踢致死的概率约为0.0006(非常罕见)。设表示“该军团被马踢致死的人数”,则服从参数为,即:

若要计算“恰好4人被马踢致死”的概率,根据,有:

博特基维奇生活在没有计算器和电脑的年代,上述计算的难度堪比徒手攀登珠穆朗玛峰:

  • 虽可手算,但涉及大数乘法,容易出错
  • 相对简单,但的计算超出了人工计算的合理范围
  • 最后,还要将这些量级相差悬殊的数值精确地相乘,这无疑是雪上加霜

幸运的是,博特基维奇发现可用参数为的泊松分布来近似计算,即:

虽然泊松分布的计算公式看起来也不简单,但比简化得多:可查表获得,避免了这样复杂的指数运算,也无需计算

为进一步验证,通过修改值计算得到更多的概率值(保留五位小数),可见近似效果极好:

2 泊松定理

博特基维奇(图 3 )指出:对于"士兵被马踢致死"这类大规模人群中发生的小概率事件,泊松分布才能很好地近似。用数学语言表述的话,即这种近似要求较大且较小。他将此结论称为 小数定律 (Law of Small Numbers),并写入其同名著作(图 4 )。

图 3 拉迪斯劳斯·博特基维奇(1868-1931)

图 4 《小数定律》

小数定律的严格数学形式也就是著名的 泊松定理 ,其精确表述为:

定理 1(泊松定理).服从参数为。当时,如果存在固定常数,使得恒成立,则有:

证明 .可推出,结合,可得:

因为当时以下成立:

根据,所以:

blanksquare

泊松定理(定理 1 )清楚地表明了与泊松分布的关系:在固定的情况下,参数为的二项分布随着的增大,会越来越接近参数为的泊松分布,如图 5 所示,其中蓝色矩形条为泊松分布,红色矩形条为二项分布。

图 5 泊松分布和二项分布

3 泊松分布的图像和性质
定理 2.服从参数为的泊松分布,则有
证明 .,下面计算其

(1)计算泊松分布的。根据,有:

其中给出,对其进行的变量代换,就可得,即有,代入上式可得:

(2)计算泊松分布的。根据,通过(1)可知,接下来求解。由可得:

和(1)类似,其中以及,代入上式可得:

所以:

(3)或换一种理解方式。若,由可知。根据泊松定理(定理 1 ),当时,的分布趋近于泊松分布,由此可推导出泊松分布的

blanksquare

结合定理 2 作出泊松分布的图像,如图 6 所示。不难理解,参数越大,相应的期望和方差同步增大,使得分布整体右移且更加分散。

图 6 泊松分布的图像

练习题 已知某疾病的患病率为0.001,某单位共5000人,求该单位患此疾病的人数不超过5人的概率。 表示“患病人数”,由题意可知其服从参数为。因此,“患病人数不超过5人”的概率可计算如下,显然其计算量很大:

根据泊松定理(定理 1 ),当较大较小时(一般),可用参数为的泊松分布来近似。在本题中,可用参数的泊松分布来近似,从而:

所以,该单位患此疾病的人数不超过5人的概率约为0.616。

关注马同学
马同学高等数学
微信公众号:matongxue314