若、、、、、两两之间,则有:
令,则有。由于这些事件两两之间,根据,以及,可得:
设、为两个,若,则有:
由于,结合下图,可知,以及。根据有限可加性,可得:
又由,可得:
上述定理之所以称为“概率的单调性”,是因为它指出了:当一个事件包含于另一个事件()时,小事件的概率必然小于等于大事件的概率(),如下图左侧所示。这就像一样,输入值越小,输出值也越小,如下图右侧所示。
对于任一,有:
根据,可知:
根据有限可加性,结合上,可得:
对于任意两个、,有:
有下图所示的两种情况,均满足,且。根据有限可加性,可得:
由于,根据概率的单调性有,代入上式可得:
上述定理之所以被称为“容斥定理”,是因为计算过程包含两个关键步骤:先“包容”,即将、的可能性都计入();再“排斥”,即将重复计算的交集部分去除,即:
该定理不止适用于两个事件,也能推广到三个、和的情况。为了帮助理解这种推广,这里给出了三个事件关系的一种情况,如下图所示。
结合上图,可以直观地得到并理解容斥定理的推广:
进而可以推广到个、、、的情况,其中各项系数遵循"排斥-包容"的交替模式: