概率论——常用分布

2021 年 10 月 11 日
筆記
数学

伯努利试验

　　伯努利试验（Bernoulli experiment）是在同样的条件下重复地、相互独立地进行的一种随机试验，其特点是该随机试验只有两种可能结果：发生或者不发生。

　　我们假设该项试验独立重复地进行了 $n$ 次，那么就称这一系列重复独立的随机试验为 $n$ 重伯努利试验，或称为伯努利概型。单个伯努利试验是没有多大意义的，然而，当我们反复进行伯努利试验，去观察这些试验有多少是成功的，多少是失败的，事情就变得有意义了，这些累计记录包含了很多潜在的非常有用的信息。

　　如果无穷随机变量序列 $X_{1}, X_{2}, \ldots$ 是独立同分布 $(i. i. d . )$ 的，而且每个随机变量 $X_{i}$ 都服从参数为 $\mathrm{p}$ 的伯努利分布, 那么随机变量 $X_{1}, X_{2}, \ldots$ 就形成参数为 $p$ 的一系列伯努利试验。同样，如果 $n$ 个随机变量 $X_{1}, X_{2}, \ldots, X_{n}$ 独立同分布，并且都服从参数为 $p$ 的伯努利分布，则随机变量 $X_{1}, X_{2}, \ldots, X_{n}$ 形成参数为 $p$ 的 $n$ 重伯努利试验。

　　下面举几个例子加以说明，假定重复抛掷一枚均匀硬币，如果在第 $i$ 次抛掷中出现正面，令 $X_{i}=1$ ；如果出现反面$X_{i}=0$，那么，随机变量 $X_{1}, X_{2}, \ldots$ 就形成参数为 $p=\frac{1}{2}$ 的一系列伯努利试验，同样，假定由一个特定机器生产的零件中 $10 \%$ 是有缺陷的，随机抽取 $n$ 个进行观测，如果第 1 个零件有缺陷，令 $X_{i}=1$ ; 如果没有缺陷，令 $X_{i}=0, i=1,2, \ldots, n$ ，那么，随机变量 $X_{1}, X_{2}, \ldots, X_{n} $ 就形成参数为 $p=\frac{1}{10}$ 的 $n$ 重伯努利试验。

离散分布

二项分布

　　定义：在 $n$ 次独立重复的伯努利试验中，设每次试验中事件 $A$ 发生的概率为 $p$。用 $X$ 表示 $n$ 重伯努利试验中事件 $A$ 发生的次数，则 $X$ 的可能取值为 $0，1，…，n$ ，且对每一个 $k$（$0≤k≤n$），事件 ${X=k}$ 即为 “ $n$ 次试验中事件 $A$ 恰好发生 $k$ 次”，随机变量 $X$ 的离散概率分布即为二项分布（Binomial Distribution）。

　　记 $X$ 为 $n$ 重伯努利试验中成功的事件 (记为 $A$ ) 的次数，则 $X=0,1,2, \cdots, n$ 。 $X$ 服从二项分布，记 $p$ 为事件 $A$ 发生的概率， $X$ 的分布列为：

　　　　$P\{X=k\}=\left(\begin{array}{l}n \\k\end{array}\right) p^{k}(1-p)^{n-k}, \quad k=0,1, \cdots, n$

　　记做

　　　　$X \sim b(n, p)$

　　　　或：$X \sim B(n, p)$

　　符号“~”读作“服从于”，该记号表示随机变量 $X$ 服从参数为 $n,p$ 的二项分布。

　　数学期望：$np$
　　方差：$np(1-p)$

　　举例：

　　1. 设射手命中率为 $0.8$ ，则射击 $n$ 次, 命中的次数 $X \sim b(n, 0.8)$ .
　　2. 已知人群中色盲率为 $p$ ，在人群中随机调查50个人，则其中色盲患者 $ X \sim b(50, p)$ .
　　3. 某药品的有效率为 $ 0.9$ , 今有 $10$ 人服用，则服药有效的人数 $ X \sim b(10,0.9)$ .
　　4…….

两点分布

　　两点分布：是一种当 $n=1$ 时的特殊的二项分布，又名 $0-1$分布，伯努利分布，用来描述一次伯努利试验中成功的次数 $X $，其中$X=0,1$ 。$X$ 服从两点分布，分布列为:

　　　　$P(X=x)=p^{x}(1-p)^{1-x}, \quad x=0,1 $

　　或表示为：

　　　　$\begin{array}{c|c|c}\mathrm{X} & 0 & 1 \\\hline P & 1-p & p\end{array}$

　　其中 $p=P(X=1)$ 为事件成功的概率。
　　举例：
　　1. 小明投篮命中率为 $ 0.8$ ，投篮一次，其命中的次数 $ X \sim b(1,0.8)$ ；
　　2. 彩票中奖率为 $ 0.0001$ , 小明购买一张彩票, 其中奖的次数 $ X \sim b(1,0.0001) $；
　　3. 不会做的单项选择题做对的概率为 $ 0.25$ ，随机选择一个选项, 做对的次数 $ X \sim b(1,0.25) $；
　　4. $ \ldots \ldots $
　　两点分布是特殊的二项分布，在二项分布数学期望和方差的公式中取 $n=1$ 得到两点分布:

　　数学期望： $p$
　　方差: $p(1-p)$

　　二项分布与两点分布的关系：若有一列独立同分布于 $ b(1, p)$ 的随机变量序列 $ \left\{X_{i}\right\}_{i=1}^{n}$ , 则其和:

　　　　$X_{1}+X_{2}+\cdots+X_{n}=\sum_{i=1}^{n} X_{i} \sim b(n, p)$

　　这个结论表明两点分布具有可加性，且对于服从 $ b(n, p)$ 的随机变量 $ X$ ，可看做由 $ n$ 个独立同分布于 $ b(1, p)$ 的随机变量 $ X_{i}$ 的和。

泊松分布

　　Poisson分布，是一种统计与概率学里常见到的离散概率分布，由法国数学家西莫恩·德尼·泊松（Siméon-Denis Poisson）在1838年时发表。

　　泊松分布的概率函数为：

　　　　$P(X=k)=\frac{\lambda^{k}}{k !} \mathrm{e}^{-\lambda}, \quad k=0,1,2, \cdots$

　　泊松分布的参数 $\lambda$ 是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。

　　记 $X \sim P(\lambda)$，常与单位时间、单位面积、单位体积上的计数过程相联系。

　　数学期望: $\lambda$

　　方差: $\lambda$

　　这里数学期望为 $ \lambda$ 是指 $ X$ 的均值为 $ \lambda$ 。譬如对于应用举例 1，某段时间内，来到某商场的顾客数平均而言是 $\lambda$ 。其他的应用类似。

　　举例：

　　1. 某时间段内，来到某商场的顾客数；

　　2. 单位时间内，某网站的点击量；

　　3. 一平方米内玻璃上的气泡数；

　　4. $ \ldots \ldots $

均匀分布

　　若随机变量 $X$ 的密度函数为：
　　　　$p(x)=\left\{\begin{array}{lc}\frac{1}{b-a}, & a<x<b \\0, & \text { 其他. }\end{array}\right.$

　　称 $ X$ 服从区间 $ (a, b)$ 上的均匀分布，记作 $ X \sim U(a, b) $，其分布函数:

　　　　$F(x)=\left\{\begin{array}{ll}0, & x<a \\\frac{x-a}{b-a}, & a \leq x<b \\1, & x \geq b\end{array}\right.$

　　均匀分布又称作平顶分布（因其概率密度为常值函数）。

　　数学期望: $\frac{a+b}{2} $
　　方差: $ \frac{(b-a)^{2}}{12}$

超几何分布

　　有 $N$ 件产品，其中有 $M$ 件不合格品。若从中不放回地随机抽取 $n$ 件，则其中含有的不合格品的件数 $X$ 服从超几何分布，分布列为:

　　　　$P(X=k)=\frac{C_{M}^{k} C_{N-M}^{n-k}}{C_{N}^{n}}=\frac{\left(\begin{array}{c}M \\k\end{array}\right)\left(\begin{array}{c}N-M \\n-k\end{array}\right)}{\left(\begin{array}{l}N \\n\end{array}\right)}, \quad k=0,1, \cdots, r$。

　　记为 $X \sim h(n, N, M)$。其中 $r=\min \{M, n\}$，且 $M \leqslant N, n \leqslant N$ 。$n, N, M$ 均为正整数。
　　举例：从有 10 件不合格品的 100 件产品中随机抽取 5 件，则抽取的产品中不合格品数 $X \sim h(5,100,10) $。

　　数学期望：$n \bullet \frac{M}{N}$

　　方差：$D(X)=\frac{n M}{N}\left(1-\frac{M}{N}\right) \frac{N-n}{N-1}$

　　超几何分布和二项分布的联系

　　(1) 在超几何分布中，当 $N \rightarrow+\infty$ 时， $\frac{M}{N} \rightarrow P$ (二项分布中的 $\mathrm{p}$) 。
　　(2) 当 $ N \rightarrow+\infty$ 时，超几何分布的数学期望

　　　　$E X=\frac{n M}{N} \rightarrow n p=E X$

　　(3) 当 $ N \rightarrow+\infty$ 时，超几何分布的方差 $ D X=n p(1-p)$ (二项分布的方差) 。
　　(4) 当 $ N \rightarrow+\infty$ 时，超几何分布近似为二项分布。

几何分布

　　在伯努利试验序列中，记每次试验中事件 $A$ 发生的概率为 $p$，如果 $X$ 为事件 $A$ 首次出现时的试验次数。详细地说，是：前 $k-1$ 次皆失败，第 $k$ 次成功的概率。则 $X=1,2, \cdots$ 。$X$ 服从几何分布，分布列为：
　　$P(X=k)=(1-p)^{k-1} p, \quad k=1,2, \cdots $
　　记作 $ X \sim G e(p) $ 。
　　举例:
　　1. 某产品的不合格率为 0.05 ，首次查到不合格品的检查次数 $ X \sim G e(0.05) $
　　2. 某射手的命中率为 0.8 , 首次命中的射击次数 $ X \sim G e(0.8) $
　　3. 掷一颗骰子，首次出现六点的投郑次数 $ X \sim G e\left(\frac{1}{6}\right) $
　　4. …..

　　数学期望： $ \frac{1}{p} $
　　方差: $ \frac{1-p}{p^{2}} $

　　几何分布的无记忆性：

　　设 $X \sim G e(p)$ ，对任意正整数 $m, n$ ，有:

　　　　$P(X>m+n \mid X>m)=P(X>n)$

　　该性质表明，在前 $m$ 次试验中 $A$ 没有出现的条件下，则在接下去的 $n$ 次试验中 $A$ 仍末出现的概率只与 $n$ 有关，而与以前的 $m$ 次试验无关，似乎忘记了前 $m$ 次试验结果，这就是无记忆性。

负二项分布

　　在伯努利试验序列中，记每次试验中事件 $A $ 发生的概率为 $p$ ，如果 $X$ 为事件 $A$ 第 $r$ 次出现时的试验次数，则 $X$ 的可能取值为 $r, r+1, \cdots, r+m, \cdots$ ，称 $X$ 服从负二项分布或巴斯卡分布，其分布列为：

　　$P(X=k)=\left(\begin{array}{l}k-1 \\r-1\end{array}\right) p^{r}(1-p)^{k-r}, \quad k=r, r+1, \cdots$

　　记作： $X \sim N b(r, p)$ , 当 $r=1$ 时即为几何分布，即几何分布是特殊的负二项分布。从二项分布和负二项分布的定义中看出，二项分布是伯努利试验次数 ($n$) 固定，事件 $A$ 成功的次数 $X$ 在 $0 \sim n$ 中取值；而负二项分布是事件 $A$ 成功的次数 ( $r$ ) 固定，伯努利实验次数 $X$ 在 $r, r+1, \cdots$ 中取值，可见负二项分布的 “负” 字的由来。

数学期望： $\frac{r}{p} $
方差: $ \frac{r(1-p)}{p^{2}}$

　　从负二项分布和几何分布的数学期望和方差的关系可知，类比二项分布与两点分布的关系，可以得到下面的结论：
　　若有一列独立同分布于 $ G e(p)$ 的随机变量序列 $ \left\{X_{i}\right\}_{i=1}^{n}$ , 则其和：

　　　　$X_{1}+X_{2}+\cdots+X_{r}=\sum \limits _{i=1}^{r} X_{i} \sim N b(r, p)$

　　这并不是说明几何分布具有可加性，因为可加性要求服从该类分布的随机变量的和仍服从该类分布，但是服从几何分布的随机变量的和服从负二项分布，这个概念要特别注意。上述结论只能说明对于服从 $ Nb(r, p)$ 的随机变量 $ X$ ，可看做由 $ r$ 个独立同分布于 $ G e(p)$ 的随机变量 $ X_{i}$ 的和。

常用连续分布

正态分布

　　正态分布（Normal distribution），也称“常态分布”，又名高斯分布（Gaussian distribution），最早由棣莫弗（Abraham de Moivre）在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。

　　若随机变量 $X$ 的密度函数为:

　　　　$p(x)=\frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}, \quad-\infty<x<\infty$

　　则称 $X$ 服从正态分布，称 $X$ 为正态变量。记 $X \sim N\left(\mu, \sigma^{2}\right) $。其中 $\mu$ 为位置参数，用于控制曲线在 $x$ 轴上的位置； $\sigma$ 为尺度参数，用于控制曲线的形状。

　　正态曲线呈钟型，两头低，中间高，左右对称因其曲线呈钟形，因此人们又经常称之为钟形曲线。
　　分布函数：

　　　　$F(x)=\int_{-\infty}^{x} p(t) \mathrm{d} t=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi} \sigma} \mathrm{e}^{-\frac{(t-\mu)^{2}}{2 \sigma^{2}}} \mathrm{~d} t$

数学期望：$\mu$

方差: $\sigma^{2} $

　　称 $ \mu=0, \sigma^{2}=1$ 时的正态分布为标准正态分布，其密度函数和分布函数分别为:

　　　　$\begin{array}{l}\varphi(x)=\frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{x^{2}}{2}} \\\Phi(x)=\int_{-\infty}^{x} \varphi(t) \mathrm{d} t=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} \mathrm{e}^{-\frac{t^{2}}{2}} \mathrm{~d} t\end{array}$

　　任何一个正态变量均可以通过标准化转化为标准正态变量，即若 X \sim N\left(\mu, \sigma^{2}\right) ，则:

　　　　$X^{*}=\frac{X-\mu}{\sigma} \sim N(0,1)$

　　其中 $ X^{*}$ 为标准正志变量。

　　性质：

　　若 $ X \sim N(0,1) $ : 　　　　

　　　　$\begin{array}{l}\Phi(-a)=1-\Phi(a) \\P(X>a)=1-\Phi(a) \\P(a<x<b)=\Phi(b)-\Phi(a) \\P(|X|<c)=2 \Phi(c)-1, \quad(c \geq 0)\end{array}$ 　　

　　若 $X \sim N\left(\mu, \sigma^{2}\right)$：　　　　

　　　　$\begin{array}{l}P(X \leq c)=\Phi\left(\frac{a-\mu}{\sigma}\right) \\P(a<x \leq b)=\Phi\left(\frac{b-\mu}{\sigma}\right)-\Phi\left(\frac{a-\mu}{\sigma}\right)\end{array}$ 　　

　　正态分布的 $ 3 \sigma$ 原则：　　　　

　　　　$\begin{aligned}P(|X-\mu|<k \sigma) &=\Phi(k)-\Phi(-k) \\&=2 \Phi(k)-1 \\&=\left\{\begin{array}{ll}0.6826, & k=1 \\0.9545, & k=2 \\0.9973, & k=3\end{array}\right.\end{aligned}$

均匀分布

　　若随机变量 $X$ 的密度函数为:

　　　　$p(x)=\left\{\begin{array}{lc}\frac{1}{b-a}, & a<x<b \\0, & \text { 其他. }\end{array}\right.$

　　称 $ X$ 服从区间 $ (a, b) $ 上的均匀分布，记作 $ X \sim U(a, b)$ , 其分布函数:

　　　　$F(x)=\left\{\begin{array}{ll}0, & x<a \\\frac{x-a}{b-a}, & a \leq x<b \\1, & x \geq b\end{array}\right.$

　　均匀分布又称作平顶分布（因其概率密度为常值函数）。

　　数学期望： $\frac{a+b}{2} $
　　方差：$\frac{(b-a)^{2}}{12}$

指数分布

　　若随机变量 $X$ 的密度函数为：

　　　　$p(x)=\left\{\begin{array}{cc}\lambda \mathrm{e}^{-\lambda x}, & x \geq 0 \\0, & x<0\end{array}\right.$

　　则称 $ X$ 服从参数为 $ \lambda$ 的指数分布，记作 $ X \sim \operatorname{Exp}(\lambda) $ 。指数分布的分布函数为:

　　　　$F(x)=\left\{\begin{array}{cl}1-\mathrm{e}^{\lambda x}, & x \geq 0 \\0, & x<0\end{array}\right.$

　　指数分布是一种偏态分布，指数分布随机变量只可能取非负实数。指数分布常被用作各种“寿命”分布，譬如电子元器件的寿命、动物的寿命、电话的通话时间、随机服务系统中的服务时间等都可假定服从指数分布。指数分布在可靠性与排队论中有着广泛的应用.。

　　数学期望: $\frac{1}{\lambda} $
　　方差: $ \frac{1}{\lambda^{2}}$

　　指数分布的无记忆性
　　若随机变量 $ X \sim \operatorname{Exp}(\lambda)$ ，则对任意的 $ t>0, s>0$ ，有:
　　　　$P(X>s+t \mid X>s)=P(X>t) $
　　证明:
　　因为 $ X \sim \operatorname{Exp}(\lambda)$ ，所以 $ P(X \geq s)=\mathrm{e}^{-\lambda s},(s>0) $。又因为
　　　　$\{X>s+t\} \subseteq\{X>s\} $
　　由条件概率可得：

　　　　$P(X>s+t \mid X>s)=\frac{P(X>s+t)}{P(X>s)}=\frac{\mathrm{e}^{-\lambda(s+t)}}{\mathrm{e}^{-\lambda t}}=\mathrm{e}^{-\lambda t}=P(X>t)$

　　证毕。

伽玛分布

　　若随机变量 $X$ 的密度函数为：

　　　　$p(x)=\left\{\begin{array}{cl}\frac{\lambda^{a}}{\Gamma(\alpha)} x^{a-1} \mathrm{e}^{-\lambda x}, & x \geqslant 0 \\0, & x<0\end{array}\right.$

　　称 $ \mathrm{X}$ 服从伽玛分布, 记作 $ X \sim G a(\alpha, \lambda)$ 。其中 $ \alpha>0$ 为形状参数，$ \lambda>0$ 为尺度参数。

　　数学期望: $\frac{\alpha}{\lambda} $

　　方差: $\frac{\alpha}{\lambda^{2}} $
　　伽玛函数的特例：
　　1. $\alpha=1$ 时的伽玛分布为指数分布: $G a(1, \lambda)=\operatorname{Exp}(\lambda)$ ,
　　2.称 $\alpha=\frac{n}{2}$, $\lambda=\frac{1}{2}$ 的伽玛分布为自由度为 $n$ 的 $\chi^{2}$ (卡方) 分布，记作 $\chi^{2}(n)$ :

　　　　$G a\left(\frac{n}{2}, \frac{1}{2}\right)=\chi^{2}(n)$

　　因卡方分布是特殊的伽玛分布，故不难求得卡方分布的：

　　数学期望： $ n $　　

　　方差： $ 2 n$

　　卡方分布的唯一参数 $n$ 称为它的自由度, 具体含义在之后的数理统计中会给出。

贝塔分布

　　先给出贝塔函数：

　　　　$\mathrm{B}(a, b)=\int_{0}^{1} x^{a-1}(1-x)^{b-1} d x$
　　其中参数 $a>0, b>0$ 。贝塔函数具有以下性质：
　　1. $B(a, b)=B(b, a) $
　　2.贝塔函数与伽玛函数有如下关系：
　　　　$\mathrm{B}(a, b)=\frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)}$
　　贝塔分布:
　　若随机变量 $X$ 的密度函数为：

　　　　$p(x)=\left\{\begin{array}{cc}\frac{\Gamma(a) \Gamma(b)}{\Gamma(a+b)} x^{a-1}(1-x)^{b-1}, & 0<x<1 \\0, & \text { 其他. }\end{array}\right.$

　　则称 $ X$ 服从贝塔分布, 记作 $X \sim B e(a, b)$ , 其中 $a>0, b>0$ 都是形状奈数。

数学期望: $\frac{a(a+1)}{(a+b)(a+b+1)} $
方差: $ \frac{a b}{(a+b)^{2}(a+b+1)}$

参考

1 常用分布

Tags: 数学

概率论——常用分布

伯努利试验

离散分布

二项分布

两点分布

泊松分布

均匀分布

超几何分布

几何分布

负二项分布

常用连续分布

正态分布

均匀分布

指数分布

伽玛分布

贝塔分布

参考

VirMach 便宜 VPS

QNews

概率论——常用分布

伯努利试验

离散分布

二项分布

两点分布

泊松分布

均匀分布

超几何分布

几何分布

负二项分布

常用连续分布

正态分布

均匀分布

指数分布

伽玛分布

贝塔分布

参考

分享此文：

Related Posts

Golang Gin 实战（八）| JSON渲染输出

python进阶（2）python最常用的模块

体验了LOL手游！我觉得这个10年老游戏又回来了

日产奇骏三缸发动机看着不抖？官方偷施“障眼法”被扒

VirMach 便宜 VPS

QNews

熱門搜尋