累积分布函数的性质

1 累积分布函数

之前学习了概率质量函数、概率密度函数,两者大同小异,主要区别在于随机变量是离散还是连续的:

概率质量函数 如果满足():
  • 非负性

  • 规范性

则称其为概率质量函数(PMF)。

概率密度函数 如果函数满足():
  • 非负性

  • 规范性

则称其为概率密度函数(PDF)。

它们都有统一的累积分布函数:

为一个随机变量,对于任意实数,称:

为随机变量的累积分布函数(CDF)。

离散随机变量和连续随机变量有所不同,离散随机变量的CDF定义为:

连续随机变量的CDF定义为:

上面的定义分散在之前的讲解中,这里总结一下,也是方便之后介绍相关的性质。

2 累积分布函数的性质

从上面的定义出发可以推出累积分布函数的三个性质(这三个性质是累积分布的充要条件,所以也可以看作是累积分布函数的另外一种定义方式:

任一函数如果满足如下三条基本性质:
  • 单调性:对任意,有
  • 有界性:对任意,有

    且有:

  • 右连续性:对任意,有:

则称其为累积分布函数(CDF)。

(1)单调性:这个好理解,是非负函数之和或者积分,自然是单调递增的。

(2)有界性:是单调递增的,再加上的规范性,所以自然有界且有上下渐近线:

(3)右连续性:这里证明较为复杂,大家可以看看下面给出的CDF图像,获得几何直观即可。

这三个性质看上去复杂,其实通过图像来理解还是很直观的。给个例子吧,下面是最简单的伯努利分布的PMF:

以及CDF:

它们的图像如下,可以看出右边的CDF是符合这三个性质的。首先函数是单调递增的;其次函数位于之间,是有界的;最后函数是右连续的(注意图中的空心点和实心点):

下面是指数分布的CDF,也满足这三点性质:

3 累积分布函数与概率

通过累积分布函数可以求出各种概率值:

这些式子最好从几何意义上来理解,下面选其中几个来解释。

(1)指的是曲线下面积:

(2)自然就是从总的面积中减去

注意上面的是空心点,表明求区间的面积,不含端点。虽然对于定积分而言是否包含端点不会影响面积的大小,但对于离散的累积分布函数而言,是否包含端点就很重要了。

(3)对于:

其中指的是点的左极限(概率论的书常这么表示左极限,右极限为),即:

这一点是需要证明的,比较复杂,这里就不证明了。借用伯努利分布的CDF图像来理解:

要求,需要沿着上图中箭头方向来逼近,即求点处的左极限:

(4)有了上面三个概率,要求就好办了,此概率等价于如下面积:

(5)对于

注意是空心点,那么自然等于如下两个面积之差:

当然还可以用纯代数的方法来解:

其余的大家可以举一反三,自行推导,最重要的是细心,不要搞错了端点的等号。

练习题 所求面积为:

都为空心点,那么所求概率为如下面积之差:

关注马同学
马同学高等数学
微信公众号:matongxue314