什么是泊松分布(Poisson Distribution)?
泊松分布是一种离散概率分布,用于描述在固定时间段或空间区域内,给定事件平均发生频率的情况下,该事件发生次数的概率。
特点
- 稀有事件:泊松分布特别适用于描述在大量机会中,某个稀有事件发生的次数。
- 独立性:事件在不同时间段或区域内的发生是相互独立的。
- 恒定的平均值:事件在给定时间段或空间区域内的平均发生率是恒定的。
- 可加性: 在离散分布中,泊松分布与二项分布都具有可加性,即:若$X$服从泊松分布$P(\lambda_1)$,$Y$服从泊松分布$P(\lambda_2)$,且$X,Y$相互独立,则随机变量$Z=X+Y$服从泊松分布$P(\lambda_1+\lambda_2)$.
参数
泊松分布 只有一个参数$\lambda$,代表给定时间段或空间区域内事件发生的平均次数。
若随机变量$X$服从参数为$\lambda$的泊松分布,记为$X\sim P(\lambda)$,其概率质量函数(注意不是概率密度函数,也不是累积分布函数)描述了随机变量$X$的分布列:$$P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}$$
其中$k$是事件发生的次数,$\lambda$是给定时间段或空间区域内事件平均发生次数,可能是“某棉布平均每米有3个瑕点“,则$\lambda = 3t$,其中$t$表示空间区域。
期望和方差
- $E(X)=\lambda$
- $Var(X)=\lambda$
泊松定理
考虑一个二项分布 $B(n,p)$,其中 $n$ 是试验次数,$p$ 是每次试验成功的概率。 如果:
- $n\to \infty$ (试验次数趋于无穷大)
- $p\to 0$ (每次试验成功的概率趋于零)
- $np\to \lambda$ (试验次数与成功概率的乘积趋于一个有限常数 $\lambda>0$)
那么,二项分布 $B(n,p)$ 的极限分布就是参数为 $λ$的泊松分布 $P(λ)$。
这个定理可以利用重要极限$\lim\limits_{n\to \infty}\left(1+\frac{1}{n}\right)^n=e$证明。
换句话说,对于一个服从二项分布 $B(n,p)$ 的随机变量 X,当 $n$ 很大,$p$ 很小,且 np 趋于一个常数 λ (通常要求$0.1\leqslant np\leqslant 10$)时,对于任意非负整数 $k$:
$$\lim\limits_{n\to \infty,p\to 0, np\to \lambda}P(X=k)=C_n^k p^k(1-p)^{n-k}=\frac{\left(np\right)^k}{k!}e^{-np}.$$
例题:
设自动机床在任何时长为$t$的时间间隔内发生故障的次数$X$服从参数为$\lambda t$的泊松分布,$Y$表示相继两次故障之间的时间间隔,则当$t>0$时,$P\{Y>t\}=?$
$\{Y>t\}$表示相继两次故障之间的时间间隔超过$t$,则说明在$t$时间间隔内没有发生故障,因此
$$P\{Y>t\}=P\{X=0\}=\frac{\left(\lambda t\right)^0}{0!}e^{-\lambda t}=e^{-\lambda t}.$$