供本地直接查看,大部分公式无法解析,请移步 概率论期末复习图片版
# 速背
分布名 | 记作 | P\ | E(X) | D(X) |
---|
01 分布 | X∼B(1,p) | p^k(1-p)^ | p | p(1−p) |
二项分布 | X∼B(n,p) | C_n^k·p^k(1-p)^ | np | np(1−p) |
泊松分布 | X∼P(λ) | \frac{\lambda^k·e^{-\lambda}} | λ | λ |
均匀分布 | X∼U(a,b) | f(x)=b−a1, x∈(a,b) | \frac{a+b} | \frac{b^2-a^2} |
指数分布 | X∼Exp(θ1) | f(x)=θ1⋅e−θx, x>0 | θ | θ2 |
正态分布 | X∼N(μ,σ2) | f(x)=2πσ1⋅e−2σ2(x−μ)2, x>0 | μ | σ2 |
- σ2(n−1)S2∼χ2(n−1)
- σ2i=1∑n(Xi−μ)2∼χ2(n)
- S/nX−μ∼t(n−1)
- σ/nX−μ∼N(0,1)
# 乘法定理
P(A1⋅⋅⋅An)=P(An∣A1⋅⋅⋅An−1)⋅P(An−1∣A1⋅⋅⋅An−2)⋅⋅⋅P(A2∣A1)⋅P(A1)
# 贝叶斯公式
P(Bi∣A)=P(A)P(A⋅Bi),可以理解成 \frac{乘法定理}
P(Bi∣A)=j=1∑nP(A∣Bj)⋅P(Bj)P(A∣Bi)⋅P(Bi)
# 独立性检验
对于 A1,...,An (n≥2) ,若其中任意 k (2≤k≤n) 个事件积的概率是各事件概率的积,则称 A1,...,An 相互独立
# 分布
# 0-1 分布
设随机变量 X 只能取 0 和 1 两个值,它的分布律是 P{x=k}=pk⋅(1−p)1−k,k=0/1
期望 | 方差 |
---|
E(X)=p | Var(x)=p(1−p)<br> |
# n 重伯努利实验(二项分布)
若试验 E 只有两个可能结果,并且独立重复 n 次
在 n 次实验中,A 发生 k 次的概率为 Cnk⋅pk⋅(1−p)n−k
记为 x∼B(n,q)
期望 | 方差 |
---|
E(X)=np | Var(x)=np(1−p) |
# 泊松分布
设 x 可取 0,1,... 而
P{x=k}=k!λk⋅e−λ
则称 x 服从参数为 λ 的泊松分布,记作 x∼P(λ)
期望 | 方差 |
---|
E(X)=λ | Var(x)=λ |
# 泊松定理
设 n⋅P=λ,则对于任意固定非负整数 k 有
n→∞limCnk⋅pk⋅(1−p)n−k=k!λk⋅e−λ
当 n 取一个较大的值的时候,即可使用(Cnk 难以计算)
# 均匀分布
若连续性随机变量 X 具有概率密度
f(x)={b−a10a<x<belse
则称 X 在区间 (a,b) 上服从均匀分布,记作 X∼U(a,b)
期望 | 方差 |
---|
E(X)=\frac{a+b} | Var(x)=\frac{(b-a)^2} |
# 分布函数
F(x)=⎩⎪⎪⎨⎪⎪⎧0b−ax−a1x<aa≤x<bx≥b
# 指数分布
若连续性随机变量 X 具有概率密度
f(x)={θ1⋅e−θx0x>0else
则称 X 服从参数为 θ 的指数分布
期望 | 方差 |
---|
E(X)=θ | Var(x)=θ2 |
# 分布函数
F(x)={1−e−θx0x≥0x<0
由分布函数,可以导出指数分布的无记忆性
∀s,t>0, P{x>s+t∣x>s}=P{x>t}
# 正态分布
若连续型随机变量 X 具有概率密度
f(x)=2πσ1⋅e2σ2−(x−μ)2
则称 X 服从参数为 σ,μ 的正态分布,记为 X∼N(μ,σ2)
期望 | 方差 |
---|
E(X)=μ | Var(x)=σ2 |
# 分布函数
F(x) = \frac{1}{\sqrt{2\pi}\sigma}·\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$$特别的,当 $\mu = 0, \sigma = 1$ 时,称 $X$ 服从==标准正态分布== - 概率密度:$\phi(x)=\frac{1}{\sqrt{2\pi}}·e^{-\frac{x^2}{2}}$ - 分布函数:$\Phi(x)=\frac{1}{\sqrt{2\pi}}·\int_{-\infty}^{x}·e^{-\frac{t^2}{2}}dt$ # 切比雪夫不等式 设随机变量 $X$ 具有期望 $\mu$ 和方差 $\sigma^2$,则对 $\forall \varepsilon > 0$ 有 $$P\{|x-\mu| \ge \varepsilon\} \le \frac{\sigma^2}{\varepsilon^2} \to P\{|x-\mu| > \varepsilon\} \ge 1 - \frac{\sigma^2}{\varepsilon^2}
# 协方差
Cov(x,y)=E{[x−E(x)]⋅[y−E(y)]}=E(xy)−E(x)⋅E(y)
- D(ax±by)=a2⋅D(x)+b2⋅D(y)±2ab⋅Cov(x,y)
# 相关系数
ρxy=D(x)⋅D(y)Cov(x,y)
- D(ax±by)=a2⋅D(x)+b2⋅D(y)±2ab⋅ρxy⋅D(x)⋅D(y)
相关系数对协方差做了标准化,消除了量纲的影响,取值范围为 [−1,1] -
ρ = 1
:完全正相关 ρ = -1
:完全负相关ρ = 0
:无线性相关性
# 不相关和相互独立的区别
- 不相干指的是无线性相关性,但可能有多次的关系
- 相互独立就是完全没关系
# 相关系数的性质
- Cov(ax,by)=ab⋅Cov(x,y)
- Cov(x1+x2,y)=Cov(x1,y)+Cov(x2,y)
- Cov(x,a)=Cov(y,b)=0
# 大数定律
# 弱大数定律(辛钦大数定律)
对 ∀ε>0 有
n→∞lim{∣n1⋅k=1∑n(xk−μ)∣<ε}=1
# 伯努利大数定律
设 fA 是 n 次独立重复试验中,事件 A 发生的次数,p 是事件 A 发生的概率,则对 ∀ε>0 有
n→∞lim{∣nfA−p∣<ε}=1
# 中心极限定理
设有 E(xk)=μ,D(xk)=σ2
则 i=1∑nxk=u 的标准化变量为 Yn=D(u)u−E(u)=nσu−nμ,对任意 x 满足
n→∞limFn(x)=n→∞limP{nσu−nμ≤x}=∫−∞x2π1e−2t2dt
即为 $$\frac {u-n\mu}{\sqrt {n}・\sigma} \sim N (0,1) \Rightarrow \frac {\frac {1}{n} u-\mu}{\sigma / \sqrt {n}} \sim N (0,1) \Rightarrow \frac {\overline {x}-\mu}{\sigma / \sqrt {n}} \sim N (0,1) $$$$\overline {x} \sim N (\mu,\sigma^2/n)$$
# 李雅普诺夫定理
设有 E(xk)=μk,D(xk)=σk2
设 Bn2=i=1∑nσk2
则 i=1∑nxk=u 的标准化变量为 Z_n=\frac{u-E(u)}{\sqrt{D(u)}}=\frac{u-\sum\limits_{i=1}^{n}\mu_k}
Zn∼N(0,1)
# 棣莫弗 - 拉普维拉斯定理
设随机变量 xn (n=1,2...) 服从参数为 n,q 的二项分布,则对任意 x 有
n→∞lim{np(1−p)xn−np≤x}=∫−∞x2π1e−2t2dt
即
np(1−p)X−np∼N(0,1)
# 抽样分布
- 样本均值:x=n1i=1∑nXi
- 样本方差:S2=n−11i=1∑n(Xi−x)2
- E(Xi)=μ,D(Xi)=σ2
- E(X)=μ
- D(\overline{X})=\frac{\sigma^2}
- E(S2)=σ2
χ2 分布 | t 分布 | F 分布 |
---|
平方和 | 平方和标准正态 | \frac{平方和} |
# χ2 分布
x1,...xn 是来自总体 N(0,1) 的样本,则称 χ2=i=1∑nxi2 服从自由度为 n 的 χ2 分布(卡方分布),记为 χ∼χ2(n)
χ2(n) 的概率密度为
f(y;n)={2n/2⋅Γ(n/2)1⋅yn/2−1⋅e−y/20y>0else
- n 是样本中有几个
- y 是 χ2=i=1∑nxi2 的取值
期望 | 方差 |
---|
E(X)=n,自由度 | Var(x)=2n |
- 可加性:χ2(k1)+χ2(k2)∼χ2(k1+k2)
# t 分布
设 X∼N(0,1),Y∼χ2(n),X 和 Y 相互独立
则称 t=Y/nX 服从自由度为 n 的 t 分布,记为 t∼t(n)
# F 分布
设 U∼χ2(n1),V∼χ2(n2),并且相互独立
则称 F=V/n2U/n1 服从自由度为 (n1,n2) 的 F 分布,记为 F∼F(n1,n2)
# 单正态抽样分布
设 X1,...,Xn 是来自正态总体 X∼N(μ,σ2) 的样本,则
- X∼N(μ,nσ2)
- X 和 S2 相互独立
- σ2(n−1)S2∼χ2(n−1)
- σ2i=1∑n(Xi−μ)2∼χ2(n)
- 推导是由 σXi−μ∼N(0,1),平方求和
- S/nX−μ∼t(n−1)
# 估计
# 矩估计
令样本 k 阶矩 = 总体 k 阶矩
- X=E(X)
# 最大似然估计
- 构造似然函数 L(θ)=i=1∏nf(xi;θ)
- 取对数 ln(L(θ))=i=1∑nln(f(xi;θ))
- 两边求导等于 0,解驻点
- 如果 L(θ) 单调的话,那么结果就取在端点,一般估计结果是 Min{x1,...,xn} 或 Max\
# 评价估计
# 无偏性
若 E(θ^)=θ,则称 θ^ 具有无偏性
# 有效性
设 θ1^ 和 θ2^ 都是无偏估计量,则 D(θi^) 小的那个,则更有效
# 区间估计
- μ 的置信区间
- σ2 已知:
(X−u2a⋅nσ,X+u2a⋅nσ)
- σ2 未知:
(X−t2a(n−1)⋅nS,X+t2a(n−1)⋅nS)
- σ2 的置信区间
- μ 已知:
(χ2a2(n)i=1∑n(Xi−μ)2,χ1−2a2(n)i=1∑n(Xi−μ)2)
- μ 为止:
(χ2a2(n−1)(n−1)S2,χ1−2a2(n−1)(n−1)S2)
# 假设检验
# 双侧检验
| 检验统计量 | 拒绝域 |
---|
σ2 已知 | U=σ/nX−μ0 | ∥u∥>u2a |
σ2 未知 | T=S/nX−μ0 | ∥t∥>t2a(n−1) |
# 单侧检验
- 检验 μ
- 原假设 H0:μ≤μ0,备择假设 H1:μ>μ0
| 检验统计量 | 拒绝域 |
---|
σ2 已知 | U=σ/nX−μ0 | u>ua |
σ2 未知 | T=S/nX−μ0 | t>ta(n−1) |
- 检验 μ
- 原假设 H0:μ≥μ0,备择假设 H1:μ<μ0
| 检验统计量 | 拒绝域 |
---|
σ2 已知 | U=σ/nX−μ0 | u<−ua |
σ2 未知 | T=S/nX−μ0 | t<−ta(n−1) |
- 检验 σ
- H0:σ2=σ02,H1:σ2=σ02
- H0:σ2=σ02,H1:σ2>σ02
- H0:σ2=σ02,H1:σ2<σ02
| 检验统计量 | 拒绝域 |
---|
μ 已知 | \chi^2=\frac{\sum\limits_{i=1}^n\left(X_i-\mu\right)^2} | $$\beginaligned}&(1)~\chi>\chi_\frac{\alpha}{2}}(n)\text~ 或~}\chi<\chi_1-\frac{\alpha}{2}}(n)\&(2)\chi^{2}>\chi_{\alpha}^{2}(n)\&(3)\chi^2}<\chi_{\alpha}(n)\end{aligned}$$ |
μ 已知 未知 | \chi^2=\frac{(n-1)S^2} | $$\beginaligned}&(1)~\chi>\chi_\frac{\alpha}{2}}(n-1)\text~ 或~}\chi<\chi_1-\frac{\alpha}{2}}(n-1)\&(2)\chi^{2}>\chi_{\alpha}^{2}(n-1)\&(3)\chi^2}<\chi_{\alpha}(n-1)\end{aligned}$$ |