泊松分布（上）

马同学

泊松分布（上）

1 泊松分布的定义

定义 1. 若的为：

则称服从参数为的泊松分布（Poisson distribution），记作。

泊松分布由法国数学家西蒙·德尼·泊松（Siméon Denis Poisson，1781-1840，图 1 ）于1837年提出。但直到19世纪末，俄国数学家拉迪斯劳斯·博特基维奇（Ladislaus Bortkiewicz）利用它研究普鲁士军人被马踢致死（图 2 ）的数据后，这一分布才广受关注。

图 1 西蒙·德尼·泊松（1781-1840）

图 2 普鲁士军队的士兵被马踢

下面用通俗的语言来讲述普鲁士军人被马踢致死的研究，以揭示泊松分布的意义。假设普鲁士某军团有1000名士兵，每名士兵被马踢致死的概率约为0.0006（非常罕见）。设表示“该军团被马踢致死的人数”，则服从参数为和的，即：

若要计算“恰好4人被马踢致死”的概率，根据，有：

博特基维奇生活在没有计算器和电脑的年代，上述计算的难度堪比徒手攀登珠穆朗玛峰：

虽可手算，但涉及大数乘法，容易出错
相对简单，但的计算超出了人工计算的合理范围
最后，还要将这些量级相差悬殊的数值精确地相乘，这无疑是雪上加霜

幸运的是，博特基维奇发现可用参数为的泊松分布来近似计算，即：

虽然泊松分布的计算公式看起来也不简单，但比简化得多：可查表获得，避免了这样复杂的指数运算，也无需计算。

为进一步验证，通过修改值计算得到更多的概率值（保留五位小数），可见近似效果极好：

2 泊松定理

博特基维奇（图 3 ）指出：对于"士兵被马踢致死"这类大规模人群中发生的小概率事件，泊松分布才能很好地近似。用数学语言表述的话，即这种近似要求较大且较小。他将此结论称为小数定律（Law of Small Numbers），并写入其同名著作（图 4 ）。

图 3 拉迪斯劳斯·博特基维奇（1868-1931）

图 4 《小数定律》

小数定律的严格数学形式也就是著名的泊松定理，其精确表述为：

定理 1（泊松定理）.设服从参数为和的。当和时，如果存在固定常数，使得恒成立，则有：

证明 .由可推出，结合，可得：

因为当时以下成立：

根据，所以：

泊松定理（定理 1 ）清楚地表明了与泊松分布的关系：在固定的情况下，参数为和的二项分布随着的增大，会越来越接近参数为的泊松分布，如图 5 所示，其中蓝色矩形条为泊松分布，红色矩形条为二项分布。

图 5 泊松分布和二项分布

3 泊松分布的图像和性质

定理 2.若服从参数为的泊松分布，则有。

证明 .设的为，下面计算其和。
（1）计算泊松分布的。根据，有：

其中为的给出，对其进行的变量代换，就可得，即有，代入上式可得：

（2）计算泊松分布的。根据有，通过（1）可知，接下来求解。由可得：

和（1）类似，其中以及，代入上式可得：

所以：

（3）或换一种理解方式。若，由可知。根据泊松定理（定理 1 ），当、且时，的分布趋近于泊松分布，由此可推导出泊松分布的和：