在上一章中,我们介绍了,其核心在于将的概率定义为实值函数的值,如图 1 所示。更一般地,函数将上的每个映射为区间上的一个实数,如图 2 所示。
也就是说,函数是以为自变量的,而我们更习惯以实数为自变量。因此本章引入了随机变量和分别列的概念,这样就可以将转为实数,从而完成概率的计算。
定义 1. 在上的实值函数称为 随机变量 (Random Variable),通常用大写字母、、等表示,其具体取值用小写字母、、等表示。根据随机变量取值范围(即随机变量的)的不同,可将其分为两大类:
-
离散随机变量 (Discrete Random Variable):其取值是有限个或可列个值这里的可列个是指虽然是无穷多个,但可以像自然数一样依次排列,比如 1, 3, 5, 7, ... 这样的序列
-
连续随机变量 (Continuous Random Variable):其取值充满区间,其中可以是,可以是
定义 1 说明,随机变量是一个将映射到实数的函数,如图 3 所示。注意比较和图 2 的区别。
下表展示了两个具体的例子,通过随机变量、,分别将“抛掷一枚硬币”和“抛掷两枚硬币”的进行了实数映射。由于这两个随机变量的取值都是有限个,因此它们都属于离散随机变量。
还可以定义随机变量,它以不同的方式来映射"抛掷两枚硬币"的样本空间,如下表所示,其中和映射到相同的值1。这个随机变量描述的是“抛掷两枚硬币得到的正面数”这个随机现象:
再来看两个连续随机变量的例子:
-
假设
是所有一年级学生的集合,如
图 4 所示。定义在
上的实值函数:
则随机变量描述的是“一年级某学生的体重”这个随机现象。由于随机抽取一名一年级学生,其体重可能是15公斤,也可能是50公斤,或是这个区间内的任意值,因此的取值范围为(单位:公斤),这说明是一个连续随机变量
-
假设
是所有电视机的集合。定义在
上的实值函数:
则随机变量描述的是“某台电视机的寿命”这个随机现象。由于某台电视机可能刚下生产线就发生故障(寿命为0),也可能一直正常工作(无法确定何时会发生故障,视寿命为),或者是这个区间内的任意值,如图 5 所示。因此的取值范围为(单位:年),这说明也是一个连续随机变量
根据上面的描述,我们可以用随机变量、、、和来表示相关的事件:
练习题1
假如你正在追求某个女生(或男生),令随机变量表示“告白成功所需的告白次数”。请问这是一个离散随机变量还是连续随机变量?
离散随机变量
连续随机变量
随机变量表示“告白成功所需的告白次数”,其可能取值为,,,,即告白次数只能是正整数。这表明有可列个取值,因此是一个离散随机变量。
练习题2
令随机变量表示“产品的重量”,其浮动范围为1至2公斤。请问这是一个离散随机变量还是连续随机变量?
离散随机变量
连续随机变量
随机变量表示“产品的重量”,其可能取值为区间上的任意实数值,因此是一个连续随机变量。