02 随机变量与常见分布 总结

1 一维

1.1 离散随机变量&离散分布

  • 概率分布函数 (随机变量
    特别地,如果 取值包含连续区间,任一点的原像概率为0,即
  • 概率分布函数的性质
    • 概率分布函数的充要条件
    • 推论

常见离散分布

离散随机变量:随机变量取值为有限或可数个时,称为离散随机变量。记其值为。特别记 对应的概率分布,称概率分布列

1 两点分布

  • 取值为 时的概率分布:,记为
  • 概率模型:一次试验是否成功

2 二项分布

  • 随机变量 的取值为 且满足,称其满足二项分布,记为
  • 概率模型:N次独立试验中的成功次数。
  • 应用:投票权大小(委员会组成);比赛规则(三局两胜,五局三胜)
    Pasted image 20241009094847.png

3 几何分布(Geom(p))

  • 随机变量 的取值为自然数N,且满足,其中
  • 概率模型:重复试验直到首次成功时的试验次数。
  • 应用:离散等待时间和无记忆性

4 超几何分布

  • 随机变量 取值为 ,且满足 ,称其满足超几何分布,记为
  • 概率模型:从大样本中抽取小样本 中特别一类(如次品),则 中次品个数 服从超几何分布。也是无放回抽签中的中奖个数的分布
  • 数学近似:较大N,M时,可以用二项分布逼近,既有放回和无放回差别不大
    Pasted image 20241009094903.png

5 泊松分布

  • 随机变量 取值为,满足 为正整数,称其满足泊松分布,记为
  • 概率模型:大量试验中的小概率事件发生次数。每年发生战争的次数,某一小时进入某邮局的顾客数,寿命超过100岁的人数
  • 数学近似:二项分布B(n,p),当n大p小,np合适大小时,可用的泊松分布近似计算。
    例:设二项分布B(100,0.01),计算
    用Poisson分布 逼近,有 ,可见误差不大
    Pasted image 20241009094915.png

1.2 连续随机变量&连续分布

  • 连续随机变量 (随机变量 取值为实数中区间)。特别称概率密度函数(probability density),可以记为,概率密度函数常常简称PDF
    tips:随机变量的取值可能既包含离散值,也包含区间,可以称为混合型随机变量
  • 概率密度函数的性质
    • 密度函数的充要条件
    • 分布函数F(x)与密度函数f(x)的关系
      (除有限点);
      Pasted image 20241009094955.png

常见连续分布

1 均匀分布

如果连续随机变量X的密度函数满足

记为

  • 概率分布函数:
  • 概率模型:等可能事件的推广
    Pasted image 20241009095019.png

2 指数分布

Pasted image 20241010102954.png
如果连续随机变量X的密度函数满足

记为

  • 概率分布函数:
    几何分布与指数分布:
  • 模型:小概率事件之间的间隔时间(等待时间)
    下一次类似汶川地震发生的时间;人或机器的寿命;排队时间;
  • 指数分布的无后效性:(在指数分布过程中,未来的事件发生概率只与当前时刻有关,与之前的事件无关;对于任意时间点t,事件在未来时间段Δt内发生的概率只依赖于Δt的长度,而与t无关)

    排队等待概率:设有两个窗口,两个人正在办理,每个人的办理时间服从指数分布,设你是下一个,则你最后办完的概率为
  • 失效函数(失效率、死亡率):定义为分布F的失效函数。
    解释:寿命到达t时刻后在dt内失效的概率。
    指数分布的失效函数为常数,称为死亡率,一般情况下是一个变化的函数
    Pasted image 20241010103523.png

3 正态分布(高斯分布,Bell曲线Normal)

Pasted image 20241010103626.png

如果连续随机变量X的密度函数满足,称X服从参数为的正态分布。记为
特别称 为标准正态分布。记其概率密度函数为。概率分布函数为

  • 概率分布函数:无初等表达式,需要查表。
    定义:任意,存在,使得,称是概率分布F的分位数
  • 模型:大量物理或生物数据的特征指标;
    高斯分布:研究测量误差的分布;IQ分数,成绩;
  • 本质上是二项分布的逼近:n充分大当可用正态分布近似计算。
3.1 标准正态分布
  • 密度函数

  • 分布函数

  • 定理:。(利用二重积分和极坐标公式证明)

  • 概率密度函数性质:关于0点对称,0点最大,两边单调。

  • 概率分布函数性质:

  • 标准正态分布表:一般记分位数,满足
    标准正态分布的常见分位数:

3.2 正态分布及分位数
  • 正态分布的线性变换:如果,则
  • 正态分布的取值分布:短尾分布(尾部即与分布的两段衰减的很快)

    应用:管理的概率:

Pasted image 20241010104412.png

1.3 复合离散随机变量&分布

设离散型随机变量 的分布律为

  1. 若对于 的不同取值 的取值 也不同,则随机变量 的分布律为:

  2. 若对于 有限个或可列无穷多个不同的取值 ,有 ,则有

1.4 复合连续随机变量&分布

  • 连续型随机变量 的概率密度为 ,函数 在区间 严格单调,其反函数 ,有连续导数,则 是一个连续型随机变量,其概率密度为:

    其中 (c,d) 为 y=g(x) 的值域。

    • 在区间 (a,b) 上严格单调递增,h'(y)>0
    • 在区间 (a,b) 上严格单调递减,h'(y)<0
  • 若函数 y=g(x) 不是严格单调的,但是在不相重叠的区间 逐段严格单调,其反函数分别为 而且  连续,则 是一个连续型随机变量,其概率密度为:

    其中, 是使得 连续的 y 的集合。

  • 正态分布

    • 正态分布的线性变换:
    • 折叠正态分布:
    • 正态分布的平方分布:

2 二维

2.1 联合分布函数

  • 随机向量的定义
    • 随机向量:随机向量 是定义在样本空间 上的实值多元函数:即每一个样本点 是个向量。通常用 Pasted image 20241009185850.png
  • 联合分布函数 (Jointed-CDF)
    • 联合分布函数 (二维随机向量 )。
      • 分布函数的充分必要条件:
      • 分类:二维离散随机向量,二维连续随机向量,混合型随机向量

2.1.1 二维离散分布

  • 二维离散分布(矩阵): 二维随机向量),
    • Pasted image 20241009104823.png

2.1.2 二维连续分布

  • 二维连续随机向量: 二维随机向量, 二元非负可积函数)。 称为联合密度函数。特别:
    • 分布函数
    • 定理:连续可微的联合分布函数有联合密度函数,所以是连续随机向量。即
  • 二维均匀分布Pasted image 20241009110716.png
  • 二维正态分布:给定 二维随机变量,称为方程 的二维正态分布,如果其概率密度函数是:

    Pasted image 20241009190630.png
    • 参数 是均值, 是差异
    • 是相关系数。

2.2 边缘分布

  • 边缘分布: ,可以定义随机变量 ,其中 ,可称为边缘随机变量,常常用 分别代替
    • 边缘分布函数
      • ;同理
      • 二维离散情形:可定义边缘分布列(即矩阵的行和或列和)
      • 二维连续情形:存在对应的边缘密度函数
      • 联合分布决定边缘分布,反之不能
  • Pasted image 20241009115938.png

2.3 条件分布

  • 离散情形
    • 二维离散随机变量,记 ,记
    • 下的条件分布律:
    • 下的条件分布律:
    • Pasted image 20241009192250.png
  • 连续情形: 连续二维随机向量的密度函数
    • 下的条件概率密度:
    • 下的条件分布函数:
    • 乘法公式 ,可推广到多个随机变量。

2.4 连续二维分布

1 均匀分布

圆盘上的均匀分布:求

2 正态分布


边缘分布
条件分布

3 独立性和高维复合随机变量

3.1 独立性

  • 定义
    • 随机变量 称为独立的,如果任意 ,事件 是独立的。即 。可以推广到 个随机变量,称为独立序列。
    • (离散情形:
  • 性质
    • 常数与任意随机变量独立;
    • 独立,则任意事件 都独立;
    • 独立,任意函数 ,则 是互相独立的。
  • 二维正态分布的坐标随机变量相互独立的充要条件是

3.2 二维随机向量的复合分布

  • 随机向量的函数
    随机向量 是定义在样本空间 上的实值 元向量函数, 的实值函数,记 ,则 是定义在 上的一个随机变量。一般考察二维向量,记为

二维离散型随机变量

设离散型随机变量 的分布律为

  1. 若对于 不同取值 ,随机变量 的取值 也不同,则随机变量 的分布律为:

  2. 对于 有限个或可列无穷多个不同取值,有,则

二维连续型随机向量

一般方法:

连续情形1: 的分布

二维连续型随机变量 ,概率密度
对任意实数 ,记 ,则

  • ,假设随机变量互相独立,则
    • 是两点分布 ,则 是二项分布
    • 是几何分布,则 是负二项分布
    • 是泊松分布 ,则 是泊松分布
    • 是指数分布,则 是二项分布
    • 正态分布 ,则 是二项分布

连续情形2: 的分布

  • 二维随机变量 的概率密度为 ,分布函数为 。有
  • n维相互独立的随机变量 ,有

连续情形3: 的分布

  • 二维随机变量 的概率密度为 ,分布函数为 。有
  • n维相互独立的随机变量 ,有

连续情形4:旋转不变的随机变量

  1. 极坐标变换 ,有
  2. ,则

  • 例1
    Pasted image 20241017141747.png
    Pasted image 20241017141757.png
  • 例2 正态分布
    Pasted image 20241017142745.png
    Pasted image 20241017142801.png
  • 例3
    Pasted image 20241017145843.png
    Pasted image 20241017145858.png
    Pasted image 20241017145928.png
    Pasted image 20241017145945.png
    Pasted image 20241017150006.png
  • 例4 指数分布
    Pasted image 20241017150114.png
    Pasted image 20241017150124.png
  • 例5 正态分布
    Pasted image 20241017150252.png
    Pasted image 20241017150300.png
  • 例6 正态分布
    Pasted image 20241017150336.png
    Pasted image 20241017150344.png
  • 例7 正态分布
    Pasted image 20241017150423.png
    Pasted image 20241017150429.png
Built with MDFriday ❤️