的核心是:将的概率定义为实值函数的值,如图 1 所示。更具体地,函数将上的每个映射为区间上的一个实数,如图 2 所示。
换句话说,函数以为自变量,而我们更习惯以实数为自变量。因此,本章引入了随机变量和分布列的概念,使得可以将转为实数,从而完成概率的计算。
定义 1. 在上的实值函数称为 随机变量 (Random Variable),通常用大写字母、、等表示,其具体取值用小写字母、、等表示。根据随机变量取值范围(即随机变量的)的不同,可将其分为两大类:
-
离散随机变量 (Discrete Random Variable):其取值是有限个或可列个值可列个是指可以像自然数一样依次排列的无穷序列,如1,3,5,7,...
-
连续随机变量 (Continuous Random Variable):其取值充满区间,其中可以是,可以是
定义 1 说明,随机变量是一个将映射到实数的函数,如图 3 所示。注意与图 2 的区别。
例如,随机变量将“抛掷一枚硬币”的映射为实数,如表 1 所示;而将“抛掷两枚硬币”的映射为实数,如表 2 所示。由于和的取值都是有限个,因此它们都属于离散随机变量。
此外,我们可以定义随机变量,它以不同的方式来映射"抛掷两枚硬币"的样本空间,如表 3 所示,其中和映射到相同的值1。与相比,虽然均基于“抛掷两枚硬币”实验,但描述的是随机现象“抛掷两枚硬币的具体结果”,而描述的是随机现象“抛掷两枚硬币得到的正面数”。
表 3
“抛掷两枚硬币”的样本空间的又一种映射方式
接下来,我们来看两个连续随机变量的例子:
-
设
是所有一年级学生的集合,如
图 4 所示。如下定义在
上的实值函数
,它描述的是“一年级某学生的体重”这个随机现象:
随机抽取一名一年级学生,其体重可能是15公斤,也可能是50公斤,或是这个区间内的任意值,因此的取值范围为(单位:公斤)。这说明是连续随机变量
-
设
是所有电视机的集合。定义在
上的实值函数
,它描述的是“某台电视机的寿命”这个随机现象:
某台电视机的寿命可能为0(刚下生产线就坏了),也可能为(一直正常工作),或是这个区间内的任意值,如图 5 所示,因此的取值范围为(单位:年),也是连续随机变量
根据上述描述,我们可以用随机变量、、、和来表示相关的事件:
练习题1
假如你正在追求某个女生(或男生),令随机变量表示“告白成功所需的告白次数”。请问这是一个离散随机变量还是连续随机变量?
离散随机变量
连续随机变量
随机变量表示“告白成功所需的告白次数”,其可能取值为,,,,即告白次数只能是正整数。这表明有可列个取值,因此是一个离散随机变量。
练习题2
令随机变量表示“产品的重量”,其浮动范围为1至2公斤。请问这是一个离散随机变量还是连续随机变量?
离散随机变量
连续随机变量
随机变量表示“产品的重量”,其可能取值为区间上的任意实数值,因此是一个连续随机变量。