供本地直接查看,大部分公式无法解析,请移步 概率论期末复习图片版

# 速背

分布名记作P\E(X)E(X)D(X)D(X)
01 分布XB(1,p)X \sim B(1, p)p^k(1-p)^ppp(1p)p(1-p)
二项分布XB(n,p)X \sim B(n, p)C_n^k·p^k(1-p)^npnpnp(1p)np(1-p)
泊松分布XP(λ)X \sim P(\lambda)\frac{\lambda^k·e^{-\lambda}}λ\lambdaλ\lambda
均匀分布XU(a,b)X \sim U(a,b)f(x)=1ba,x(a,b)f(x) = \frac{1}{b-a},~x\in(a,b)\frac{a+b}\frac{b^2-a^2}
指数分布XExp(1θ)X \sim Exp(\frac{1}{\theta})f(x)=1θexθ,x>0f(x)=\frac{1}{\theta}·e^{-\frac{x}{\theta}},~x>0θ\thetaθ2\theta^2
正态分布XN(μ,σ2)X \sim N(\mu, \sigma^2)f(x)=12πσe(xμ)22σ2,x>0f(x) = \frac{1}{\sqrt{2\pi}\sigma}·e^{-\frac{(x-\mu)^2}{2\sigma^2}},~x>0μ\muσ2\sigma^2
  • (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
  • i=1n(Xiμ)2σ2χ2(n)\frac{\sum\limits_{i=1}^{n}(X_i-\mu)^2}{\sigma^2} \sim \chi^2(n)
  • XμS/nt(n1)\frac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)
  • Xμσ/nN(0,1)\frac{\overline{X}-\mu}{\sigma/\sqrt{n}} \sim N(0,1)

# 乘法定理

P(A1An)=P(AnA1An1)P(An1A1An2)P(A2A1)P(A1)P(A_1···A_n)=P(A_n|A_1···A_{n-1})·P(A_{n-1}|A_1···A_{n-2})···P(A_2|A_1)·P(A_1)

# 贝叶斯公式

P(BiA)=P(ABi)P(A)P(B_i|A)=\frac{P(A·B_i)}{P(A)},可以理解成 \frac{乘法定理}

P(BiA)=P(ABi)P(Bi)j=1nP(ABj)P(Bj)P(B_i|A)=\frac{P(A|B_i)·P(B_i)}{\sum\limits_{j=1}^{n}P(A|B_j)·P(B_j)}

# 独立性检验

对于 A1,...,An(n2)A_1,...,A_n~(n \ge 2) ,若其中任意 k(2kn)k~(2 \le k \le n) 个事件积的概率是各事件概率的积,则称 A1,...,AnA_1,...,A_n 相互独立

# 分布

# 0-1 分布

设随机变量 XX 只能取 0011 两个值,它的分布律是 P{x=k}=pk(1p)1k,k=0/1P\{x=k\}=p^k·(1-p)^{1-k},k=0/1

期望方差
E(X)=pE(X)=pVar(x)=p(1p)Var(x)=p(1-p)<br>

# n 重伯努利实验(二项分布)

若试验 EE 只有两个可能结果,并且独立重复 nn
nn 次实验中,AA 发生 kk 次的概率为 Cnkpk(1p)nkC_n^k·p^k·(1-p)^{n-k}
记为 xB(n,q)x \sim B(n, q)

期望方差
E(X)=npE(X)=npVar(x)=np(1p)Var(x)=np(1-p)

# 泊松分布

xx 可取 0,1,...0,1,...

P{x=k}=λkeλk!P\{x=k\}=\frac{\lambda^k·e^{-\lambda}}{k!}

则称 xx 服从参数为 λ\lambda 的泊松分布,记作 xP(λ)x \sim P(\lambda)

期望方差
E(X)=λE(X)=\lambdaVar(x)=λVar(x)=\lambda

# 泊松定理

nP=λn·P=\lambda,则对于任意固定非负整数 kk

limnCnkpk(1p)nk=λkeλk!\lim\limits_{n \to \infty} C_n^k·p^k·(1-p)^{n-k} = \frac{\lambda^{k}·e^{-\lambda}}{k!}

nn 取一个较大的值的时候,即可使用(CnkC_n^k 难以计算)

# 均匀分布

若连续性随机变量 XX 具有概率密度

f(x)={1baa<x<b0elsef(x) = \begin{cases}\frac{1}{b-a} & a<x<b\\0 & else\end{cases}

则称 XX 在区间 (a,b)(a,b) 上服从均匀分布,记作 XU(a,b)X \sim U(a,b)

期望方差
E(X)=\frac{a+b}Var(x)=\frac{(b-a)^2}

# 分布函数

F(x)={0x<axabaax<b1xbF(x)=\begin{cases}0 & x<a\\\frac{x-a}{b-a} & a \le x < b\\1 & x \ge b\end{cases}

# 指数分布

若连续性随机变量 XX 具有概率密度

f(x)={1θexθx>00elsef(x) = \begin{cases}\frac{1}{\theta}·e^{-\frac{x}{\theta}} & x>0\\0 & else\end{cases}

则称 XX 服从参数为 θ\theta 的指数分布

期望方差
E(X)=θE(X)=\thetaVar(x)=θ2Var(x)=\theta^2

# 分布函数

F(x)={1exθx00x<0F(x) = \begin{cases}1 - e^{-\frac{x}{\theta}} & x \ge 0 \\0 & x<0\end{cases}

由分布函数,可以导出指数分布的无记忆性

s,t>0,P{x>s+tx>s}=P{x>t}\forall s,t > 0,~P\{x>s+t|x>s\}=P\{x>t\}

# 正态分布

若连续型随机变量 XX 具有概率密度

f(x)=12πσe(xμ)22σ2f(x)=\frac{1}{\sqrt{2\pi}\sigma}·e^{\frac{-(x-\mu)^2}{2\sigma^2}}

则称 XX 服从参数为 σ,μ\sigma,\mu 的正态分布,记为 XN(μ,σ2)X \sim N(\mu, \sigma^2)

期望方差
E(X)=μE(X)=\muVar(x)=σ2Var(x)=\sigma^2

# 分布函数

F(x) = \frac{1}{\sqrt{2\pi}\sigma}·\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt$$特别的,当 $\mu = 0, \sigma = 1$ 时,称 $X$ 服从==标准正态分布== - 概率密度:$\phi(x)=\frac{1}{\sqrt{2\pi}}·e^{-\frac{x^2}{2}}$ - 分布函数:$\Phi(x)=\frac{1}{\sqrt{2\pi}}·\int_{-\infty}^{x}·e^{-\frac{t^2}{2}}dt$ # 切比雪夫不等式 设随机变量 $X$ 具有期望 $\mu$ 和方差 $\sigma^2$,则对 $\forall \varepsilon > 0$ 有 $$P\{|x-\mu| \ge \varepsilon\} \le \frac{\sigma^2}{\varepsilon^2} \to P\{|x-\mu| > \varepsilon\} \ge 1 - \frac{\sigma^2}{\varepsilon^2}

# 协方差

Cov(x,y)=E{[xE(x)][yE(y)]}=E(xy)E(x)E(y)Cov(x,y)=E\{[x-E(x)]·[y-E(y)]\}=E(xy)-E(x)·E(y)

  • D(ax±by)=a2D(x)+b2D(y)±2abCov(x,y)D(ax \pm by) = a^2·D(x) + b^2·D(y) \pm 2ab · Cov(x,y)

# 相关系数

ρxy=Cov(x,y)D(x)D(y)\rho_{xy}=\frac{Cov(x,y)}{\sqrt{D(x)}·\sqrt{D(y)}}

  • D(ax±by)=a2D(x)+b2D(y)±2abρxyD(x)D(y)D(ax \pm by) = a^2·D(x) + b^2·D(y) \pm 2ab · \rho_{xy}·\sqrt{D(x)}·\sqrt{D(y)}
    相关系数对协方差做了标准化,消除了量纲的影响,取值范围为 [1,1][-1,1]
  • ​​ ρ = 1 ​​:完全正相关
  • ρ = -1 ​​:完全负相关
  • ρ = 0 :无线性相关性

# 不相关和相互独立的区别

  • 不相干指的是无线性相关性,但可能有多次的关系
  • 相互独立就是完全没关系

# 相关系数的性质

  • Cov(ax,by)=abCov(x,y)Cov(ax, by)=ab·Cov(x,y)
  • Cov(x1+x2,y)=Cov(x1,y)+Cov(x2,y)Cov(x_1+x_2, y)=Cov(x_1,y)+Cov(x_2,y)
  • Cov(x,a)=Cov(y,b)=0Cov(x,a) = Cov(y,b)=0

# 大数定律

# 弱大数定律(辛钦大数定律)

ε>0\forall \varepsilon > 0

limn{1nk=1n(xkμ)<ε}=1\lim\limits_{n \to \infty} \{|\frac{1}{n}·\sum\limits_{k=1}^{n}(x_k-\mu)| <\varepsilon\} = 1

# 伯努利大数定律

fAf_Ann 次独立重复试验中,事件 AA 发生的次数,pp 是事件 AA 发生的概率,则对 ε>0\forall \varepsilon > 0

limn{fAnp<ε}=1\lim\limits_{n \to \infty} \{|\frac{f_A}{n}-p| < \varepsilon\}=1

# 中心极限定理

设有 E(xk)=μ,D(xk)=σ2E(x_k) = \mu,D(x_k)=\sigma^2
i=1nxk=u\sum\limits_{i=1}^{n}x_k=u 的标准化变量为 Yn=uE(u)D(u)=unμnσY_n = \frac{u-E(u)}{\sqrt{D(u)}}=\frac{u-n\mu}{\sqrt{n}\sigma},对任意 xx 满足

limnFn(x)=limnP{unμnσx}=x12πet22dt\lim\limits_{n \to \infty}F_n(x)=\lim\limits_{n \to \infty}P\{\frac{u-n\mu}{\sqrt{n}\sigma} \le x\}=\int_{-\infty}^{x}\frac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}} dt

即为 $$\frac {u-n\mu}{\sqrt {n}・\sigma} \sim N (0,1) \Rightarrow \frac {\frac {1}{n} u-\mu}{\sigma / \sqrt {n}} \sim N (0,1) \Rightarrow \frac {\overline {x}-\mu}{\sigma / \sqrt {n}} \sim N (0,1) $$$$\overline {x} \sim N (\mu,\sigma^2/n)$$

# 李雅普诺夫定理

设有 E(xk)=μk,D(xk)=σk2E(x_k) = \mu_k,D(x_k)=\sigma_{k}^2
Bn2=i=1nσk2B_n^2=\sum\limits_{i=1}^{n} \sigma_k^2
i=1nxk=u\sum\limits_{i=1}^{n}x_k=u 的标准化变量为 Z_n=\frac{u-E(u)}{\sqrt{D(u)}}=\frac{u-\sum\limits_{i=1}^{n}\mu_k}

ZnN(0,1)Z_n \sim N(0,1)

# 棣莫弗 - 拉普维拉斯定理

设随机变量 xn(n=1,2...)x_n~(n=1,2...) 服从参数为 n,qn,q 的二项分布,则对任意 xx

limn{xnnpnp(1p)x}=x12πet22dt\lim\limits_{n \to \infty}\{\frac{x_{n}-np}{\sqrt{np(1-p)}} \le x\} = \int_{-\infty}^{x} \frac{1}{\sqrt{2\pi}}{e^{-\frac{t^2}{2}}}dt

Xnpnp(1p)N(0,1)\frac{X-np}{\sqrt{np(1-p)}} \sim N(0,1)

# 抽样分布

  • 样本均值:x=1ni=1nXi\overline{x}=\frac{1}{n}\sum\limits_{i=1}^{n}X_i
  • 样本方差:S2=1n1i=1n(Xix)2S^2=\frac{1}{n-1}\sum\limits_{i=1}^{n}(X_i-\overline{x})^2
  • E(Xi)=μ,D(Xi)=σ2E(X_i)=\mu,D(X_i)=\sigma^2
  • E(X)=μE(\overline{X})=\mu
  • D(\overline{X})=\frac{\sigma^2}
  • E(S2)=σ2E(S^2)=\sigma^2
χ2\chi^2 分布tt 分布FF 分布
平方和标准正态平方和\frac{标准正态}{\sqrt{平方和}}\frac{平方和}

# χ2 分布

x1,...xnx_1,...x_n 是来自总体 N(0,1)N(0,1) 的样本,则称 χ2=i=1nxi2\chi^2=\sum\limits_{i=1}^{n}x_i^2 服从自由度为 nnχ2\chi^2 分布(卡方分布),记为 χχ2(n)\chi \sim \chi^2(n)
χ2(n)\chi^2(n) 的概率密度为

f(y;n)={12n/2Γ(n/2)yn/21ey/2y>00elsef(y;n)=\begin{cases}\frac{1}{2^{n/2}·\Gamma(n/2)}·y^{n/2-1}·e^{-y/2} & y>0\\0 & else\end{cases}

  • nn 是样本中有几个
  • yyχ2=i=1nxi2\chi^2=\sum\limits_{i=1}^{n}x_i^2 的取值
期望方差
E(X)=nE(X)=n,自由度Var(x)=2nVar(x)=2n
  • 可加性:χ2(k1)+χ2(k2)χ2(k1+k2)\chi^2(k_1)+\chi^2(k_2) \sim \chi^2(k_1+k_2)

# t 分布

XN(0,1),Yχ2(n)X \sim N(0,1), Y \sim \chi^2(n)XXYY 相互独立
则称 t=XY/nt=\frac{X}{\sqrt{Y/n}} 服从自由度为 nntt 分布,记为 tt(n)t \sim t(n)

# F 分布

Uχ2(n1),Vχ2(n2)U \sim \chi^2(n_1), V \sim \chi^2(n_2),并且相互独立
则称 F=U/n1V/n2F = \frac{U / n_1}{V / n_2} 服从自由度为 (n1,n2)(n_1,n_2)FF 分布,记为 FF(n1,n2)F \sim F(n_1, n_2)

# 单正态抽样分布

X1,...,XnX_1,...,X_n 是来自正态总体 XN(μ,σ2)X \sim N(\mu, \sigma^2) 的样本,则

  • XN(μ,σ2n)\overline{X} \sim N(\mu, \frac{\sigma^2}{n})
  • X\overline{X}S2S^2 相互独立
  • (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
  • i=1n(Xiμ)2σ2χ2(n)\frac{\sum\limits_{i=1}^{n}(X_i-\mu)^2}{\sigma^2} \sim \chi^2(n)
    • 推导是由 XiμσN(0,1)\frac{X_i-\mu}{\sigma} \sim N(0, 1),平方求和
  • XμS/nt(n1)\frac{\overline{X}-\mu}{S/\sqrt{n}} \sim t(n-1)

# 估计

# 矩估计

令样本 kk 阶矩 = 总体 kk 阶矩

  • X=E(X)\overline{X} = E(X)

# 最大似然估计

  • 构造似然函数 L(θ)=i=1nf(xi;θ)L(\theta) = \prod\limits_{i=1}^{n} f(x_i;\theta)
  • 取对数 ln(L(θ))=i=1nln(f(xi;θ))ln(L(\theta))=\sum\limits_{i=1}^{n}ln(f(x_i;\theta))
  • 两边求导等于 00,解驻点
    • 如果 L(θ)L(\theta) 单调的话,那么结果就取在端点,一般估计结果是 Min{x1,...,xn}Min\{x_1,...,x_n\} 或 Max\

# 评价估计

# 无偏性

E(θ^)=θE(\hat{\theta})=\theta,则称 θ^\hat{\theta} 具有无偏性

# 有效性

θ1^\hat{\theta_1}θ2^\hat{\theta_2} 都是无偏估计量,则 D(θi^)D(\hat{\theta_i}) 小的那个,则更有效

# 区间估计

  • μ\mu ​​的置信区间
    • σ2\sigma^2 已知:
      • (Xua2σn,X+ua2σn)(\overline{X}-u_{\frac{a}{2}}·\frac{\sigma}{\sqrt{n}},\overline{X}+u_{\frac{a}{2}}·\frac{\sigma}{\sqrt{n}})

    • σ2\sigma^2 未知:
      • (Xta2(n1)Sn,X+ta2(n1)Sn)(\overline{X}-t_{\frac{a}{2}}(n-1)·\frac{S}{\sqrt{n}},\overline{X}+t_{\frac{a}{2}}(n-1)·\frac{S}{\sqrt{n}})

  • σ2\sigma^2 的置信区间
    • μ\mu 已知:
      • (i=1n(Xiμ)2χa22(n),i=1n(Xiμ)2χ1a22(n))(\frac{\sum\limits_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{\frac{a}{2}}(n)},\frac{\sum\limits_{i=1}^{n}(X_i-\mu)^2}{\chi^2_{1-\frac{a}{2}}(n)})

    • μ\mu 为止:
      • ((n1)S2χa22(n1),(n1)S2χ1a22(n1))(\frac{(n-1)S^2}{\chi^2_{\frac{a}{2}}(n-1)},\frac{(n-1)S^2}{\chi^2_{1-\frac{a}{2}}(n-1)})

# 假设检验

# 双侧检验

检验统计量拒绝域
σ2\sigma^2 已知U=Xμ0σ/nU=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}u>ua2\|u\|>u_{\frac{a}{2}}
σ2\sigma^2 未知T=Xμ0S/nT=\frac{\overline{X}-\mu_0}{S / \sqrt{n}}t>ta2(n1)\|t\| > t_{\frac{a}{2}}(n-1)

# 单侧检验

  • 检验 μ\mu
    • 原假设 H0:μμ0H_0:\mu \le \mu_0,备择假设 H1μ>μ0H_1:\mu > \mu_0
检验统计量拒绝域
σ2\sigma^2 已知U=Xμ0σ/nU=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}u>uau > u_a
σ2\sigma^2 未知T=Xμ0S/nT=\frac{\overline{X}-\mu_0}{S / \sqrt{n}}t>ta(n1)t > t_{a}(n-1)
  • 检验 μ\mu
    • 原假设 H0:μμ0H_0:\mu \ge \mu_0,备择假设 H1μ<μ0H_1:\mu < \mu_0
检验统计量拒绝域
σ2\sigma^2 已知U=Xμ0σ/nU=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}u<uau < -u_a
σ2\sigma^2 未知T=Xμ0S/nT=\frac{\overline{X}-\mu_0}{S / \sqrt{n}}t<ta(n1)t < -t_{a}(n-1)
  • 检验 σ\sigma
    1. H0σ2=σ02,H1σ2σ02H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 \neq \sigma_0^2
    2. H0σ2=σ02,H1σ2>σ02H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 > \sigma_0^2
    3. H0σ2=σ02,H1σ2<σ02H_0:\sigma^2=\sigma_0^2,H_1:\sigma^2 < \sigma_0^2
检验统计量拒绝域
μ\mu 已知\chi^2=\frac{\sum\limits_{i=1}^n\left(X_i-\mu\right)^2}$$\beginaligned}&(1)~\chi({2)>\chi_\frac{\alpha}{2}}({2)(n)\text~({2)~}\chi<\chi_1-\frac{\alpha}{2}}({2)(n)\&(2)\chi^{2}>\chi_{\alpha}^{2}(n)\&(3)\chi^2}<\chi_{\alpha}({2)(n)\end{aligned}$$
μ\mu 已知 未知\chi^2=\frac{(n-1)S^2}$$\beginaligned}&(1)~\chi({2)>\chi_\frac{\alpha}{2}}({2)(n-1)\text~({2)~}\chi<\chi_1-\frac{\alpha}{2}}({2)(n-1)\&(2)\chi^{2}>\chi_{\alpha}^{2}(n-1)\&(3)\chi^2}<\chi_{\alpha}({2)(n-1)\end{aligned}$$