【超几何分布列的数学期望和方差公式】在概率论与数理统计中,超几何分布是一种描述在不放回抽样情况下成功次数的概率分布。它常用于从有限总体中抽取样本时的随机事件分析。本文将对超几何分布的数学期望和方差进行总结,并通过表格形式清晰展示其公式。
一、超几何分布简介
超几何分布适用于以下情形:
- 总体中有 $ N $ 个个体;
- 其中 $ K $ 个是“成功”个体(如合格品);
- 从中不放回地抽取 $ n $ 个个体;
- 设 $ X $ 表示这 $ n $ 个个体中“成功”的数量,则 $ X \sim H(N, K, n) $。
二、超几何分布的数学期望与方差
超几何分布的数学期望和方差是衡量其集中趋势和离散程度的重要指标,具体公式如下:
指标 | 公式 | 说明 |
数学期望 | $ E(X) = n \cdot \frac{K}{N} $ | 表示在 $ n $ 次抽样中,“成功”个体的平均数量;与二项分布相似,但考虑不放回抽样。 |
方差 | $ \text{Var}(X) = n \cdot \frac{K}{N} \cdot \left(1 - \frac{K}{N}\right) \cdot \frac{N - n}{N - 1} $ | 表示“成功”次数的波动程度;比二项分布的方差小一个因子 $ \frac{N - n}{N - 1} $,称为有限总体校正因子。 |
三、公式推导简要说明
1. 数学期望:
超几何分布的期望可以看作是二项分布期望的修正版本。由于每次抽样不放回,因此每一步的成功概率会略微变化,但整体上仍可近似为 $ n \cdot \frac{K}{N} $。
2. 方差:
超几何分布的方差与二项分布类似,但因不放回抽样导致样本之间存在相关性,从而引入了有限总体校正因子 $ \frac{N - n}{N - 1} $。当 $ N $ 很大时,该因子接近于 1,此时超几何分布趋近于二项分布。
四、应用举例
假设一个班级有 50 名学生,其中 20 名是女生。从中随机抽取 5 名学生,求其中女生人数的期望与方差。
- $ N = 50 $,$ K = 20 $,$ n = 5 $
- 数学期望:$ E(X) = 5 \cdot \frac{20}{50} = 2 $
- 方差:$ \text{Var}(X) = 5 \cdot \frac{20}{50} \cdot \left(1 - \frac{20}{50}\right) \cdot \frac{50 - 5}{50 - 1} = 5 \cdot 0.4 \cdot 0.6 \cdot \frac{45}{49} \approx 1.08 $
五、总结
超几何分布广泛应用于质量控制、抽样调查等领域。其数学期望和方差公式简洁明了,能够有效反映样本中“成功”个体的平均表现及其波动情况。理解这些公式有助于更好地进行数据分析和决策支持。
附录:公式符号说明
- $ N $:总体容量
- $ K $:总体中“成功”个体的数量
- $ n $:抽取样本的数量
- $ X $:样本中“成功”个体的数量
- $ E(X) $:数学期望
- $ \text{Var}(X) $:方差