0%

[概率與數理模型]概统概要

这是北航概率与数理模型概要。

概統,
終結。

目录

概率论的基本概念

  • 随机试验 EE

    • 可以在相同条件下重复进行
    • 每次试验结果可能不止一个,但能事先确定试验的所有可能结果
    • 每次试验之前无法确定哪一个结果会出现
  • 样本空间:随机试验 EE 的所有可能结果组成的集合 SS

  • 样本点:SS 中的每个元素,即 EE 的每个结果,称为样本点

  • 随机事件:随机试验 EE 的样本空间 SS可列的子集,简称事件

    • 此子集的一个样本点发生时,表示事件发生
    • 基本事件:由一个样本点组成的事件
    • 必然事件:样本空间 SS 是自身的子集,它必然发生
    • 不可能事件:\varnothing 不包含任何样本点,不可能发生
  • 事件运算

    • 包含:ABA\subset B
    • 相等:A=BA = B
    • 和事件:ABA \cup B
    • 积事件:ABA \cap B
    • 差事件:ABA - B
    • 互斥事件:AB=A\cap B=\varnothing
    • 对立事件:AB  and  AB=A\cup B \;\text{and}\; A\cap B=\varnothing,事件 AA 的对立事件记为 Aˉ\bar{A}
    • 交换律
    • 结合律
    • 分配律
    • 德摩根律
    • 更多……

频率 概率

  • 频率:相同条件下 nn 次实验发生了 nAn_A 次事件 AA(频次为 nAn_A),则事件 AA 的频率为

    fn(A)=nAn f_n(A)=\frac{n_A}{n}
    • 一定意义下,n,fn(A)P(A)n \rightarrow \infty, f_n(A) \rightarrow P(A),详参伯努利大数定律
  • 概率:EE 是随机试验,SS 是其样本空间,EE 的每一个事件 AA,赋予其一个实数 P(A)P(A),称为事件 AA 的概率

    • 非负性:A,P(A)0\forall A, P(A) \ge 0
    • 规范性:对于必然事件 SS,有 P(S)=1P(S)=1
    • 可列可加性:对于一系列互斥事件 A1,A2,...A_1, A_2,...,有 P(A1A2...)=P(A1)+P(A2)+...P(A_1\cup A_2\cup ...) = P(A_1) + P(A_2) + ...
  • 概率的性质

    • P()=0P(\varnothing)=0
    • P(Aˉ)=1P(A)P(\bar{A})=1-P(A)
    • P(AB)=P(A)+P(B)P(AB)P(A\cup B)=P(A)+P(B)-P(AB)

古典概型

  • 试验的样本空间包含有限个元素

  • 每个基本事件发生的可能性相同

  • 古典概型中事件 AA 包含 kk 个基本事件,样本空间 SS 中包含 nn 个基本事件,则其概率为:

P(A)=kn P(A)=\frac{k}{n}

条件概率

  • AABB 是两个事件,且 P(A)>0P(A) > 0,则称:

P(BA)=P(AB)P(A) P(B|A)=\frac{P(AB)}{P(A)}

为事件 AA 发生的条件下事件 BB 发生的条件概率

  • 条件概率的乘法公式

P(A)P(BA)=P(AB) P(A)P(B|A)=P(AB)
  • 多个事件的乘法公式

P(ABC)=P(CAB)P(BA)P(A) P(ABC)=P(C|AB)P(B|A)P(A)
  • 全概率公式:设试验 EE 的样本空间为 SSAAEE 的事件,B1B_1B2B_2,… BnB_nSS 的一个划分,且 P(Bi)>0P(B_i) > 0,则

P(A)=P(AB1)P(B1)+P(AB2)P(B2)+...+P(ABn)P(Bn) P(A) = P(A|B_1)P(B_1)+P(A|B_2)P(B_2)+...+P(A|B_n)P(B_n)
  • 贝叶斯公式

P(BiA)=P(ABi)P(Bi)P(A) P(B_i|A)=\frac{P(A|B_i)P(B_i)}{P(A)}

独立性

  • AA, BB 是两事件,如果满足等式:

P(AB)=P(A)P(B) P(AB)=P(A)P(B)

则称事件 AA, BB 相互独立

  • 若事件 AA, BB 相互独立,则:

P(BA)=P(B) P(B|A)=P(B)
  • 若事件 AA, BB 相互独立,则 AABˉ\bar BAˉ\bar ABBAˉ\bar ABˉ\bar B 相互独立

随机变量及其分布

  • 随机变量:设样本空间为 S={e}S=\{e\}[1]X=X(e)X=X(e) 是定义在 SS 上的单值函数,则称 X=X(e)X=X(e) 为随机变量

离散型随机变量及其分布

  • 离散型随机变量的分布律:设随机变量 XX 所有可能的取值为 xkx_k,则

P{X=xk}=pk P\{X=x_k\}=p_k

亦可以用表格表示

  • 0 - 1 分布

    • 分布律
    P{X=k}=pk(1p)1k P\{X=k\}=p^k(1-p)^{1-k}
X 0 1
pkp_k 1-p p
  • 伯努利试验:试验 EE 只有 AAAˉ\bar A 两个结果

  • n 重伯努利试验:将 EE 独立重复试验 n 次

  • 二项分布 XB(n,p)X\sim B(n, p)

    • 分布律
    P{X=k}=Cnkpk(1p)1k P\{X=k\}=\text{C}_n^k p^k(1-p)^{1-k}
  • 泊松分布 Xπ(λ)X\sim \pi(\lambda)

    • 分布律
    P{X=k}=λkeλk! P\{X=k\}=\frac{\lambda^ke^{-\lambda}}{k!}
    • 泊松分布近似二项分布:取参数 λ=np\lambda=np,得到
    Cnkpk(1p)1kλkeλk! \text{C}_n^k p^k(1-p)^{1-k}\approx \frac{\lambda^ke^{-\lambda}}{k!}

随机变量的分布函数

  • XX 是随机变量,xx 是任意实数,函数

F(x)=P{Xx},<x< F(x)=P\{X\le x\}, \quad -\infty<x<\infty

称为 XX 的分布函数

  • P{x1<xx2}=F(x2)F(x1)P\{x_1<x\le x_2\}=F(x_2)-F(x_1)
  • P{x>a}=1F(a)P\{x>a\}=1-F(a)
  • P{x=a}=F(a)F(a0)P\{x=a\}=F(a)-F(a-0)
  • F(x)F(x) 不减
  • 0F(x)10\le F(x) \le 1
    • F()=0,  F()=1F(-\infty)=0,\;F(\infty)=1
  • F(x)F(x) 右连续

连续型随机变量及其概率密度

  • 对于随机变量 XX,存在非负可积函数 f(x)f(x) 使得对于任意实数有

F(x)=xf(t)dt F(x)=\int_{-\infty}^xf(t)\text{d}t

则称 XX 是连续型随机变量,f(x)f(x) 称为 XX 的概率密度函数

  • f(x)0f(x)\ge 0
  • f(x)dx=1\int_{-\infty}^\infty f(x)\text{d}x=1
  • P{x1<Xx2}=F(x2)F(x1)=x1x2f(x)dxP\{x_1<X\le x_2\}=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)\text{d}x
  • f(x)f(x)xx 处连续,则 F(x)=f(x)F'(x)=f(x)

  • 均匀分布 XU(a,b)X\sim U(a,b)

    • 概率密度
    f(x)={1ba,a<x<b0,else f(x)= \left \{ \begin{matrix} \begin{aligned} & \frac{1}{b-a},\quad a<x<b \\ & 0,\quad \text{else} \end{aligned} \end{matrix} \right.
  • 指数分布 XE(λ)X\sim E(\lambda)

    • 概率密度
    f(x)={λeλx,x>00,else f(x)= \left \{ \begin{matrix} \begin{aligned} & \lambda e^{-\lambda x},\quad x>0 \\ & 0,\quad \text{else} \end{aligned} \end{matrix} \right.
  • 正态分布高斯分布 XN(μ,σ2)X\sim N(\mu,\sigma^2)

    • 概率密度
    f(x)=12πσe(xμ)22σ2,<x< f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},\quad -\infty<x<\infty
    • μ=0,σ=1\mu=0,\sigma=1 时称为标准正态分布,分布函数记为 Φ(x)\Phi(x)
    • 引理:若随机变量 XN(μ,σ2)X\sim N(\mu,\sigma^2),则
    Z=XμσN(0,1) Z=\frac{X-\mu}{\sigma}\sim N(0,1)
    • XX 服从正态分布,则 XX 的线性函数 Y=aX+bY=aX+b 也服从正态分布
  • 定理:设随机变量 XX 有概率密度 fX(x)f_X(x)<x<-\infty<x<\infty,设 g(x)g(x) 处处可导且恒有 g(x)>0g'(x)>0(或 g(x)<0g'(x)<0),则 Y=g(X)Y=g(X) 是随机变量,且

fY(y)={fX[h(y)]h(y),α<y<β0,else f_Y(y)= \left \{ \begin{matrix} \begin{aligned} & f_X[h(y)]|h'(y)|,\quad \alpha<y<\beta\\ & 0,\quad \text{else} \end{aligned} \end{matrix} \right.

其中 α,β\alpha,\betayy 的定义域下界和上界,h(y)h(y)g(x)g(x) 的反函数

多维随机变量及其分布

联合分布

  • 联合分布函数

F(x,y)=P{Xx,Yy} F(x,y)=P\{X\le x,Y\le y\}
  • 二维离散型随机变量

    • 联合分布律
    P{X=xi,Y=yj}=pij P\{X=x_i,Y=y_j\}=p_{ij}

    亦可以用表格表示

  • 二维连续型随机变量

    • 联合概率密度
    F(x,y)=yxf(u,v)dudv F(x,y)=\int_{-\infty}^y\int_{-\infty}^x f(u,v)\text{d}u\text{d}v

    f(x,y)f(x,y) 称为联合概率密度

    • f(x,y)0f(x,y) \ge 0
    • f(x,y)dxdy=1\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f(x,y)\text{d}x\text{d}y = 1
    • (X,Y)(X,Y) 落在平面 xOyxOyGG 区域的概率是 p=Gf(x,y)dxdyp=\iint\limits_G f(x,y)\text{d}x\text{d}y
    • f(x,y)f(x,y)(x,y)(x,y) 处连续,则 2F(x,y)xy=f(x,y)\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)

边缘分布

  • 边缘分布函数

FX(x)=P{Xx}=F(x,)FY(y)=P{Yy}=F(,y) \begin{aligned} & F_X(x)=P\{X\le x\}=F(x,\infty) \\ & F_Y(y)=P\{Y\le y\}=F(\infty,y) \\ \end{aligned}
  • 二维离散型随机变量

    • 边缘分布律
    P{X=xi}=j=1pijP{Y=yj}=i=1pij \begin{aligned} & P\{X=x_i\}=\sum_{j=1}^{\infty}p_{ij}\\ & P\{Y=y_j\}=\sum_{i=1}^{\infty}p_{ij}\\ \end{aligned}
  • 二维连续型随机变量

    • 边缘概率密度
    fX(x)=f(x,y)dyfY(y)=f(x,y)dx \begin{aligned} & f_X(x)=\int_{-\infty}^{\infty}f(x,y)\text{d}y\\ & f_Y(y)=\int_{-\infty}^{\infty}f(x,y)\text{d}x\\ \end{aligned}

条件分布

  • 条件分布函数

FXY(xy)=P{XxY=y} F_{X|Y}(x|y)=P\{X\le x | Y=y\}
  • 二维离散型随机变量

    • 条件分布律
    P{X=xiY=yj}=P{X=xi,Y=yj}P{Y=yj}=pijpjP{Y=yjX=xi}=P{X=xi,Y=yj}P{X=xi}=pijpi \begin{aligned} & P\{X=x_i|Y=y_j\}=\frac{P\{X=x_i,Y=y_j\}}{P\{Y=y_j\}}=\frac{p_{ij}}{p_{\cdot j}} \\ & P\{Y=y_j|X=x_i\}=\frac{P\{X=x_i,Y=y_j\}}{P\{X=x_i\}}=\frac{p_{ij}}{p_{i\cdot}} \\ \end{aligned}
  • 二维连续型随机变量

    • 条件概率密度:在 Y=yY=y 的条件下 XX 的条件概率密度为
    fXY=f(x,y)fY(y) f_{X|Y}=\frac{f(x,y)}{f_Y(y)}
    • 条件 = 联合 / 边缘

相互独立的随机变量

  • F(x,y)F(x,y) 是联合分布函数,FX(x)F_X(x)FY(y)F_Y(y) 是边缘分布函数,若对于所有 x,yx,y 满足
FX(x)FY(y)=F(x,y) F_X(x)F_Y(y)=F(x,y)

XXYY 相互独立

  • 二维离散型随机变量

P{X=xi,Y=yi}=P{X=xi}P{Y=yi} P\{X=x_i,Y=y_i\}=P\{X=x_i\}P\{Y=y_i\}
  • 二维连续型随机变量

f(x,y)=fX(x)fY(y) f(x,y)=f_X(x)f_Y(y)

两个随机变量的函数的分布

  • Z=X+YZ=X+Y
fX+Y(z)=f(zy,y)dyorf(x,zx)dx f_{X+Y}(z)=\int_{-\infty}^{\infty}f(z-y,y)\text{d}y\quad \text{or} \quad \int_{-\infty}^{\infty}f(x,z-x)\text{d}x
  • X,YX,Y 相互独立,则

fX+Y(z)=fX(zy)fY(y)dyorfX(x)fY(zx)dx f_{X+Y}(z)=\int_{-\infty}^{\infty}f_X(z-y)f_Y(y)\text{d}y\quad \text{or} \quad \int_{-\infty}^{\infty}f_X(x)f_Y(z-x)\text{d}x

这被称为 fXf_XfYf_Y 的卷积公式,记为 fXfYf_X * f_Y

  • 有限个相互独立的正态分布的随机变量的线性组合仍然服从正态分布

  • Z=YXZ=\frac{Y}{X} 的分布
  • Z=XYZ=XY 的分布
  • Z=max{X,Y}Z=\max\{X,Y\}Z=min{X,Y}Z=\min\{X,Y\} 的分布(X,YX,Y 相互独立)
    • Fmax(z)=FX(z)FY(z)F_{\max}(z)=F_X(z)F_Y(z)
    • Fmin(z)=1[1FX(z)][1FY(z)]F_{\min}(z)=1-[1-F_X(z)][1-F_Y(z)]
    • 以上结果可以推广到 nn 个独立同分布的随机变量
  • XX 的分布函数是 FX(x)F_X(x)(严格单调递增且连续,即存在唯一反函数 FX1(x)F^{-1}_X(x)),Y=FX(X)Y=F_X(X) 是复合随机变量,则当 y(0,1)y\in(0,1) 时,
FY(y)=P{Yy}=P{FX(X)y}=P{XFX1(y)}=FX[FX1(y)]=y \begin{aligned} F_Y(y) & =P\{Y\le y\} \\ & = P\{F_X(X)\le y\} \\ & = P\{X \le F^{-1}_X(y)\} \\ & = F_X[F_X^{-1}(y)] \\ & = y \end{aligned}

随机变量的数字特征

数学期望

  • 数学期望记为 E(X)E(X)

  • 离散型随机变量

E(X)=k=1xkpk E(X)=\sum_{k=1}^\infty x_kp_k
  • 连续型随机变量

E(X)=xf(x)dx E(X)=\int_{-\infty}^\infty xf(x)\text{d}x
  • XB(n,p)E(X)=npX\sim B(n,p) \quad E(X)=np
  • XN(μ,σ2)E(X)=μX\sim N(\mu,\sigma^2) \quad E(X)=\mu
  • Xπ(λ)E(X)=λX\sim \pi(\lambda) \quad E(X)=\lambda
  • XU(a,b)E(X)=a+b2X\sim U(a,b) \quad E(X)=\frac{a+b}{2}
  • XE(λ)E(X)=1λX\sim E(\lambda) \quad E(X)=\frac{1}{\lambda}
  • 性质

    • CC 是常数,E(C)=0E(C)=0
    • E(aX+C)=aE(X)+CE(aX+C)=aE(X)+C
    • E(X+Y)=E(X)+E(Y)E(X+Y)=E(X)+E(Y),可以推广到任意有限个随机变量的和的情况
    • X,YX,Y 相互独立,则 E(XY)=E(X)E(Y)E(XY)=E(X)E(Y),此条逆命题不成立
  • 定理

    • XX 是离散型随机变量,g(x)g(x) 是连续函数,Y=g(X)Y=g(X)
    E(Y)=k=1g(xk)pk E(Y)=\sum_{k=1}^\infty g(x_k)p_k
    • XX 是连续型随机变量,g(x)g(x) 是连续函数,Y=g(X)Y=g(X)
    E(Y)=g(x)f(x)dx E(Y)=\int_{-\infty}^\infty g(x)f(x)\text{d}x
    • Z=g(X,Y)Z=g(X,Y)X,YX,Y 的概率密度是 f(x,y)f(x,y),则
    E(Z)=g(x,y)f(x,y)dxdy E(Z)=\int_{-\infty}^\infty\int_{-\infty}^\infty g(x,y)f(x,y)\text{d}x\text{d}y
  • 琴生Jensen不等式

    • f(x)f(x) 是凸函数,则
    E(f(X))f(E(X)) E(f(X)) \ge f(E(X))

    对应函数的弦在弧的上方

    • f(x)f(x) 是凹函数,则
    E(f(X))f(E(X)) E(f(X)) \le f(E(X))

    对应函数的弦在弧的下方

方差

  • 方差记为 D(X)D(X)Var(X)\text{Var}(X)

D(X)=E{[XE(X)]2}=E(X2)E2(X) D(X)=E\{[X-E(X)]^2\}=E(X^2)-E^2(X)
  • 标准差 σ(X)\sigma(X)

σ(X)=D(X) \sigma(X)=\sqrt{D(X)}
  • 标准化变量:设随机变量 XX 的数学期望为 E(X)=μE(X)=\mu,方差为 D(X)=σ20D(X)=\sigma^2\ne0,则记

X=Xμσ X^*=\frac{X-\mu}{\sigma}

XX 的标准化变量,数学期望为 0,方差为 1

  • XB(n,p)D(X)=np(1p)X\sim B(n,p) \quad D(X)=np(1-p)
  • XN(μ,σ2)D(X)=σ2X\sim N(\mu,\sigma^2) \quad D(X)=\sigma^2
  • Xπ(λ)D(X)=λX\sim \pi(\lambda) \quad D(X)=\lambda
  • XU(a,b)D(X)=(ba)212X\sim U(a,b) \quad D(X)=\frac{(b-a)^2}{12}
  • XE(λ)D(X)=1λ2X\sim E(\lambda) \quad D(X)=\frac{1}{\lambda^2}
  • 性质

    • CC 是常数,D(C)=0D(C)=0
    • D(aX+C)=a2D(X)D(aX+C)=a^2D(X)
    • D(X+Y)=D(X)+D(Y)+2E{[XE(X)][YE(Y)]}=D(X)+D(Y)+2Cov(X,Y)D(X+Y)=D(X)+D(Y)+2E\{[X-E(X)][Y-E(Y)]\} = D(X)+D(Y)+2\text{Cov}(X,Y)

    X,YX,Y 相互独立,则

    D(X+Y)=D(X)+D(Y) D(X+Y)=D(X)+D(Y)

    可以推广到任意有限多个相互独立的随机变量之和的情况

协方差 相关系数

  • 协方差记为 Cov(X,Y)\text{Cov}(X,Y),有

Cov(X,Y)=E{[XE(X)][YE(Y)]} \text{Cov}(X,Y)=E\{[X-E(X)][Y-E(Y)]\}

展开得

Cov(X,Y)=E(XY)E(X)E(Y) \text{Cov}(X,Y)=E(XY)-E(X)E(Y)
  • 性质

    • Cov(aX,bY)=abCov(X,Y)\text{Cov}(aX,bY)=ab\text{Cov}(X,Y)a,ba,b 是常数
    • Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)\text{Cov}(X_1+X_2,Y)=\text{Cov}(X_1,Y)+\text{Cov}(X_2,Y)
  • 随机变量 X,YX,Y 的相关系数记为 ρXY\rho_{XY}

ρXY=Cov(X,Y)D(X)D(Y) \rho_{XY}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
  • 定理

    • ρXY1|\rho_{XY}|\le 1
  • ρXY=0\rho_{XY}=0 称为 X,YX,Y 不相关
    • 对于二维正态随机变量 (X,Y)(X,Y) 而言,X,YX,Y 不相关和 X,YX,Y 相互独立等价
  • 二维正态分布

    • (X,Y)(X,Y) 的概率密度是
    f(x,y)=12πσ1σ21ρ2exp{12(1ρ2)[(xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22]} f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}\exp\Big\{\frac{-1}{2(1-\rho^2)}\Big[\frac{(x-\mu_1)^2}{\sigma^2_1}\\-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma^2_2}\Big]\Big\}
    • 记作 (X,Y)N(μ1,σ1;μ2,σ2;ρ)(X,Y)\sim N(\mu_1,\sigma_1;\mu_2,\sigma_2;\rho)
    • 两个边缘分布都是正态分布
    • E(X)=μ1,D(X)=σ12E(X)=\mu_1,D(X)=\sigma^2_1 以及 E(Y)=μ2,D(Y)=σ22E(Y)=\mu_2,D(Y)=\sigma^2_2
    • 在二维正态分布下,相关系数 ρ=0\rho=0 表示 X,YX,Y 相互独立

矩 协方差矩阵

  • k 阶原点矩

E(Xk),k=1,2,... E(X^k),\quad k=1,2,...
  • 协方差矩阵

大数定律 中心极限定理

辛钦大数定律

  • X1,X2,...X_1,X_2,... 是相互独立且服从同一分布 (独立同分布) 的随机变量序列,具有数学期望 E(Xk)=μ  (k=1,2,...)E(X_k)=\mu\;(k=1,2,...),则对于任意 ε>0\varepsilon>0,有

limnP{1nk=1nXkμ<ε}=1 \lim_{n\rightarrow\infty}P\Big\{ \Big|\frac{1}{n}\sum_{k=1}^{n}X_k-\mu\Big|<\varepsilon\Big\}=1

Xˉ\bar X 依概率收敛到数学期望 μ\mu

XˉPμ \bar X\overset{P}{\longrightarrow}\mu

伯努利大数定律

  • fAf_Ann 次独立重复试验中事件 AA 发生的次数,pp 是事件 AA 发生的概率,则对于任意 ε>0\varepsilon>0,有

limnP{fAnp<ε}=1 \lim_{n\rightarrow\infty}P\Big\{ \Big| \frac{f_A}{n}-p\Big|<\varepsilon\Big\}=1

表面在试验次数足够多的时候,频率趋近于概率

中心极限定理

  • 独立同分布的中心极限定理:设随机变量序列 X1,X2,...,XnX_1,X_2,...,X_n 相互独立且服从同一分布,具有数学期望 E(Xk)=μE(X_k)=\mu 和方差 D(Xk)=σ2D(X_k)=\sigma^2,则

XˉN(μ,σ2n)ori=1nXiN(nμ,nσ2) \bar X \sim N(\mu,\frac{\sigma^2}{n}) \quad \text{or} \quad \sum_{i=1}^n X_i \sim N(n\mu,n\sigma^2)
  • 棣莫弗De Moivre - 拉普拉斯Laplace定理:设随机变量 XB(n,p)X \sim B(n,p),则

P{Xnpnp(1p)x}Φ(x) P\Big\{\frac{X-np}{\sqrt{np(1-p)}} \le x \Big\} \approx \Phi(x)

其中 Φ(x)\Phi(x) 表示标准正态分布的分布函数

样本及抽样分布

随机样本

  • 总体:试验的全部可能的观察值称为总体

  • 个体:每一个可能的观察值

  • 容量:总体中包含的个体的个数

  • 简单随机样本:设 XX 是具有分布函数 FF 的随机变量,若 X1,X2,...,XnX_1,X_2,...,X_n 是独立同分布(FF)的随机变量序列,则称此随机变量序列为从总体 XX 得到的容量为 nn 的简单随机样本,简称为样本。它们的观察值 x1,x2,...,xnx_1,x_2,...,x_n 称为样本值

抽样分布

  • 统计量:X1,X2,...,XnX_1,X_2,...,X_n 是样本,g(X1,X2,...,Xn)g(X_1,X_2,...,X_n) 是一个不含未知参数的函数,则其是一统计量

  • 样本均值

Xˉ=1ni=1nXi \bar X=\frac{1}{n}\sum_{i=1}^{n}X_i
  • 样本方差

S2=1n1i=1n(XiXˉ)2 S^2=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar X)^2

注意,样本方差与总体方差不同

  • 样本标准差

S=S2 S=\sqrt{S^2}

  • 样本 k 阶原点矩

Ak=1ni=1nXik,kN A_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k,\quad k \in \mathbb{N}^*
  • 样本 k 阶中心矩

Bk=1ni=1n(XiXˉ)k,kN B_k=\frac{1}{n}\sum_{i=1}^n (X_i-\bar X)^k, \quad k \in \mathbb{N}^*

χ2\chi^2 分布

  • X1,X2,...,XnX_1,X_2,...,X_n 来自总体 XN(0,1)X \sim N(0,1),则

χ2=X12+X22+...+Xn2 \chi^2 = X_1^2 + X_2^2 + ... + X_n^2

服从自由度为 nnχ2\chi^2 分布,记作 χ2χ2(n)\chi^2 \sim \chi^2(n)

  • 概率密度

  • 性质

    • χ12χ2(n),χ22χ2(m)\chi^2_1 \sim \chi^2(n),\chi^2_2 \sim \chi^2(m),且 χ12,χ22\chi^2_1,\chi^2_2 相互独立,则
    χ12+χ22χ2(n+m) \chi^2_1+\chi^2_2 \sim \chi^2(n+m)
    • 数学期望
    E(χ2)=n E(\chi^2)=n
    • 方差
    D(χ2)=2n D(\chi^2)=2n
    • 分布表

t 分布

  • XN(0,1),Yχ2(n)X\sim N(0,1),Y\sim \chi^2(n),且 X,YX,Y 相互独立,则

t=XY/n t=\frac{X}{\sqrt{Y/n}}

服从自由度为 nnt 分布学生氏分布,记作 tt(n)t \sim t(n)

  • 概率密度

  • 性质

    • t1α(n)=tα(n)t_{1-\alpha}(n) = -t_{\alpha}(n) (类似正态分布的对称性)

F 分布

  • Xχ2(n1),Yχ2(n2)X\sim \chi^2(n_1),Y \sim \chi^2(n_2),且 X,YX,Y 相互独立,则

F=X/n1Y/n2 F=\frac{X/n_1}{Y/n_2}

服从自由度为 (n1,n2)(n_1,n_2) 的 F 分布,记作 FF(n1,n2)F \sim F(n_1,n_2)

  • 概率密度

  • 性质

    • 1FF(n2,n1)\frac{1}{F} \sim F(n_2,n_1)
    • F1α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\frac{1}{F_{\alpha}(n_2,n_1)}

正态总体的样本均值和方差的分布

  • 任意分布的总体 XX 的均值为 μ\mu,方差为 σ2\sigma^2X1,X2,...,XnX_1,X_2,...,X_n 来自 XX 的一个样本,Xˉ\bar X 是样本均值,S2S^2 是样本方差,则

E(Xˉ)=μD(Xˉ)=σ2nE(S2)=σ2D(S2)=2σ4n1 \begin{aligned} & E(\bar X)=\mu\\ & D(\bar X) = \frac{\sigma^2}{n}\\ & E(S^2) = \sigma^2 \\ & D(S^2) = \frac{2\sigma^4}{n-1} \end{aligned}
  • 定理(X1,X2,...,XnX_1,X_2,...,X_n 来自正态总体)

    • Xˉ\bar XS2S^2 相互独立
    • XiX_i 是来自正态总体 N(μ,σ2)N(\mu,\sigma^2) 的样本,Xˉ\bar X 是样本均值,则
    XiXˉN(0,n1nσ2) X_i-\bar X \sim N(0,\frac{n-1}{n}\sigma^2)
    • (n1)S2σ2χ2(n1)\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)

    因此 D((n1)S2σ2)=(n1)σ2D(S2)=2n2D(S2)=2σ4n1D(\frac{(n-1)S^2}{\sigma^2})=\frac{(n-1)}{\sigma^2}D(S^2)=2n-2 \longrightarrow D(S^2)=\frac{2\sigma^4}{n-1}

    • XˉμS/nt(n1)\frac{\bar X-\mu}{S/\sqrt{n}} \sim t(n-1)
  • 定理(X1,X2,...,XnX_1,X_2,...,X_nY1,Y2,...,YnY_1,Y_2,...,Y_n 来自两个正态总体,且二者相互独立)

    • S12/S22σ12/σ22F(n11,n21)\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \sim F(n_1-1,n_2-1)

参数估计

点估计

矩估计法

最大似然估计法

  • 总体 XX 是离散型,P{X=x}=p(x;θ)P\{X=x\}=p(x;\theta)θ\theta 未知)

    • 似然函数 L(θ)L(\theta) 为:
    L(θ)=i=1np(xi;θ) L(\theta)=\prod_{i=1}^np(x_i;\theta)
  • 总体 XX 是连续型,,概率密度为 f(x;θ)f(x;\theta)

    • 似然函数 L(θ)L(\theta) 为:
    L(θ)=i=1nf(xi;θ) L(\theta)=\prod_{i=1}^nf(x_i;\theta)
  • 使似然函数最大,得到 θ^\hat{\theta} 称为最大似然估计值,即

ddθL(θ)=0 \frac{\text{d}}{\text{d}\theta}L(\theta)=0

ddθlnL(θ)=0 \frac{\text{d}}{\text{d}\theta}\ln L(\theta)=0

第二种称为对数似然方程

估计量的评选标准

  • 无偏性:估计量 θ^\hat{\theta} 的数学期望存在且

E(θ^)=θ E(\hat{\theta})=\theta

则称为无偏估计量

  • 有效性:估计量 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 都是无偏估计量,且有

D(θ^1)D(θ^2) D(\hat{\theta}_1)\le D(\hat{\theta}_2)

则称 θ^1\hat{\theta}_1θ^2\hat{\theta}_2 更有效

  • 一致相合性:θ^\hat{\theta} 是估计量,且 θ^\hat{\theta} 依概率收敛到 θ\theta,则 θ^\hat{\theta}一致相合估计量

区间估计

  • 置信区间:设总体 XX 的分布函数含有一个未知参数 θ\theta,对于给定的 α\alpha,用样本确立两个统计量 θˉ\bar \thetaθ\underline \theta,使得

P{θ<θ<θˉ}1α P\{\underline \theta < \theta < \bar \theta\} \ge 1-\alpha

则称区间 (θ,θˉ)(\underline \theta,\bar \theta) 为置信水平 1α1-\alpha 的置信区间,二者称为置信下限和置信上限

  • 方法

    1. 对于样本 X1,X2,...,XnX_1,X_2,...,X_n,寻找一个函数 g(X1,X2,...,Xn;θ)g(X_1,X_2,...,X_n;\theta),使得:
      • gg 含有待估参数 θ\theta
      • 不含其余参数
      • 分布已知且不依赖于待估参数
        这样的 gg 被称为枢轴量
    2. 给定显著性水平 α\alpha,定出常数 a,ba,b 使得
    P{a<g(X1,X2,...,Xn;θ)<b}=1α P\{a<g(X_1,X_2,...,X_n;\theta)<b\}=1-\alpha
    1. a<g(X1,X2,...,Xn;θ)<ba<g(X_1,X_2,...,X_n;\theta)<b 解出 θ<θ<θˉ\underline \theta < \theta < \bar \theta,得到置信区间 (θ,θˉ)(\underline \theta,\bar \theta)
  • 正态总体的区间估计

待估参数 其他参数条件 枢轴量
μ\mu σ2\sigma^2 已知 Z=Xˉμσ/nN(0,1)Z=\frac{\bar X-\mu}{\sigma/\sqrt{n}} \sim N(0,1)
μ\mu σ2\sigma^2 未知 t=XˉμS/nt(n1)t=\frac{\bar X-\mu}{S/\sqrt{n}} \sim t(n-1)
σ2\sigma^2 μ\mu 未知 χ2=(n1)S2σ2χ2(n1)\chi^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
μ1μ2\mu_1-\mu_2 σ12,σ22\sigma^2_1,\sigma^2_2 已知 Z=(XˉYˉ)(μ1μ2)σ12n1+σ22n2N(0,1)Z=\frac{(\bar X-\bar Y)-(\mu_1 - \mu_2)}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2}}} \sim N(0,1)
μ1μ2\mu_1-\mu_2 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2 未知 t=(XˉYˉ)(μ1μ2)SW1n1+1n2t(n1+n22)t=\frac{(\bar X-\bar Y)-(\mu_1 - \mu_2)}{S_W\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2),其中 SW2=(n11)S12+(n21)S22n1+n22S_W^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}
σ12σ22\frac{\sigma^2_1}{\sigma^2_2} μ1,μ2\mu_1,\mu_2 未知 F=S12/S22σ12/σ22F(n11,n21)F=\frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2} \sim F(n_1-1,n_2-1)

假设检验

  • 零假设原假设 H0H_0:认为假设的场景不发生的一种假设,例如需要检验“产量提升了”这一假设,零假设就是“产量没有提升”

  • 备择假设 H1H_1:零假设被拒绝之后可选的假设

  • 拒绝域:当检验统计量取某个区域 CC 中的值的时候,拒绝 H0H_0,则称区域 CC 为拒绝域。拒绝域的边界称为临界点

  • 第 I 类错误:当 H0H_0 实际为真时,拒绝之,称为“弃真”

  • 第 II 类错误:当 H0H_0 实际为假时,接受之,称为“取伪”

  • 显著性检验:只对犯第 I 类错误的概率加以限制,而不考虑犯第 II 类错误的概率的检验

  • 双边假设检验

H0:μ=μ0,H1:μμ0 H_0:\mu=\mu_0,\quad H_1:\mu \ne \mu_0
  • 右边检验

H0:μμ0,H1:μ>μ0 H_0:\mu \le \mu_0, \quad H_1:\mu > \mu_0
  • 左边检验

H0:μμ0,H1:μ<μ0 H_0:\mu \ge \mu_0, \quad H_1:\mu < \mu_0
  • 方法

    1. 提出零假设和备择假设
    2. 给定显著性水平 α\alpha 和样本容量 nn
    3. 确定检验统计量
    4. P{Reject  H0  when it’s true}αP\{\text{Reject}\;H_0\; \text{when it's true}\} \le \alpha 求出拒绝域
    5. 取样,根据样本观察值做出决策
  • 正态总体的假设检验

待检验假设 其他参数条件 检验统计量
μ\muμ0\mu_0 大小关系 σ2\sigma^2 已知 Z=Xˉμσ/nN(0,1)Z=\frac{\bar X-\mu}{\sigma/\sqrt{n}} \sim N(0,1)
μ\muμ0\mu_0 大小关系 σ2\sigma^2 未知 t=XˉμS/nt(n1)t=\frac{\bar X-\mu}{S/\sqrt{n}} \sim t(n-1)
σ2\sigma^2σ02\sigma_0^2 大小关系 μ\mu 未知 χ2=(n1)S2σ2χ2(n1)\chi^2=\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)
μ1μ2\mu_1-\mu_2δ\delta 大小关系 σ12,σ22\sigma^2_1,\sigma^2_2 已知 Z=(XˉYˉ)δσ12n1+σ22n2N(0,1)Z=\frac{(\bar X-\bar Y)-\delta}{\sqrt{\frac{\sigma^2_1}{n_1}+\frac{\sigma^2_2}{n_2}}} \sim N(0,1)
μ1μ2\mu_1-\mu_2δ\delta 大小关系 σ12=σ22=σ2\sigma^2_1=\sigma^2_2=\sigma^2 未知 t=(XˉYˉ)δSW1n1+1n2t(n1+n22)t=\frac{(\bar X-\bar Y)-\delta}{S_W\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} \sim t(n_1+n_2-2),其中 SW2=(n11)S12+(n21)S22n1+n22S_W^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}
σ12\sigma^2_1σ22\sigma^2_2 大小关系 μ1,μ2\mu_1,\mu_2 未知 F=S12S22F(n11,n21)F=\frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1)

参数估计与假设检验的关系

  • 在显著性水平 α\alpha 下,对待估参数 θ\theta 得到一个置信度为 1α1-\alpha 的置信区间 (θ,θˉ)(\underline \theta,\bar \theta)(单侧置信区间同理),今在同样显著性水平下有一假设 H0:θ=θ0H_0:\theta=\theta_0,那么

if  θ0(θ,θˉ)  thenAccept  H0else thenReject  H0endif \begin{aligned} & \text{if}\; \theta_0 \in (\underline \theta,\bar \theta) \; \text{then} \\ & \quad \text{Accept} \; H_0 \\ & \text{else then} \\ & \quad \text{Reject} \; H_0 \\ & \text{endif} \end{aligned}

方差分析 回归分析

单因素试验的方差分析

  • 试验指标:试验中要考察的指标

  • 因素:影响试验指标的条件

  • 水平:因素所在的状态

  • 单因素试验:在一项试验的过程中,只有一个因素在改变

  • 多因素试验:在一项试验的过程中,多于一个因素在改变

  • 方差分析的任务

    1. 检验 ss 个总体 N(μ1,σ2),...,N(μs,σ2)N(\mu_1,\sigma^2),...,N(\mu_s,\sigma^2) 的均值是否相等,即
    H0:μ0=μ1=...=μs H_0:\mu_0=\mu_1=...=\mu_s
    1. 作出未知参数 μ1,...,μs,σ2\mu_1,...,\mu_s,\sigma^2 的估计
  • 设因素 AAss 个水平 A1,...,AsA_1,...,A_s,在第 jj 个水平下,进行了 njn_j 次独立试验。

水平 结果1 结果2 结果 njn_j 样本均值 总体均值
AjA_j X1,jX_{1,j} X2,jX_{2,j} Xnj,jX_{n_j,j} Xˉ,j\bar X_{\cdot,j} μj\mu_j
  • 总平均(总体均值的加权平均)

μ=1j=1snjj=1snjμj \mu=\frac{1}{\sum_{j=1}^sn_j}\sum_{j=1}^sn_j\mu_j
  • 效应 δj\delta_j:水平 AjA_j 下总体均值和总平均的差异

δj=μjμ \delta_j=\mu_j-\mu

且有 n1δ1+...+nsδs=0n_1\delta_1+...+n_s\delta_s=0

  • 方差分析的数学模型

{Xi,j=μ+δj+εi,jεi,jN(0,σ2),各 εi,j 独立i=1,2,...,nj,  j=1,2,...,sj=1snjδj=0 \left \{ \begin{matrix} \begin{aligned} & X_{i,j}=\mu+\delta_j+\varepsilon_{i,j} \\ & \varepsilon_{i,j}\sim N(0,\sigma^2),\text{各 } \varepsilon_{i,j} \text{ 独立} \\ & i=1,2,...,n_j,\; j=1,2,...,s \\ & \sum_{j=1}^sn_j\delta_j=0 \end{aligned} \end{matrix} \right.
  • 零假设改写为

H0:δ1=δ2=...=δs=0 H_0:\delta_1=\delta_2=...=\delta_s=0
  • 三个方差

    • 总偏差平方和总变差 STS_T:每个观察值与数据总平均的差值的平方和
    ST=j=1si=1nj(Xi,jXˉ)2 S_T=\sum_{j=1}^s\sum_{i=1}^{n_j}(X_{i,j}-\bar X)^2

    其中 Xˉ=1nj=1si=1njXi,j\bar X = \frac{1}{n}\sum_{j=1}^s\sum_{i=1}^{n_j}X_{i,j},即全部观察值的平均值

    • 误差平方和 SES_E:水平 AjA_j 下,样本观察值与样本均值的差值的平方和
    SE=j=1si=1nj(Xi,jXˉ,j)2 S_E=\sum_{j=1}^s\sum_{i=1}^{n_j}(X_{i,j}-\bar X_{\cdot,j})^2
    • 效应平方和 SAS_A:水平 AjA_j 下,样本均值与数据总平均的差值的平方和
    SA=j=1si=1nj(Xˉ,jXˉ)2 S_A=\sum_{j=1}^s\sum_{i=1}^{n_j}(\bar X_{\cdot,j}-\bar X)^2
    • ST=SE+SAS_T=S_E+S_A
  • 统计特性

    • SEσ2χ2(ns)\frac{S_E}{\sigma^2}\sim\chi^2(n-s)
    • E(SEσ2)=nsE(SEns)=σ2E(\frac{S_E}{\sigma^2})=n-s \longrightarrow E(\frac{S_E}{n-s})=\sigma^2,即 SEns\frac{S_E}{n-s}σ2\sigma^2 的无偏估计
    • H0H_0 为真时,SAσ2χ2(s1)E(SAs1)=σ2\frac{S_A}{\sigma^2}\sim\chi^2(s-1) \longrightarrow E(\frac{S_A}{s-1})=\sigma^2
  • H0H_0 的拒绝域:显著性水平 α\alpha
F=SA/(s1)SE/(ns)Fα(s1,ns) F=\frac{S_A/(s-1)}{S_E/(n-s)} \ge F_\alpha(s-1,n-s)

双因素试验的方差分析

好累啊,我不想写了。

回归分析

不考说是。


  1. ee 表示样本空间的元素,用 {e}\{e\} 表示样本空间。 ↩︎

-------------本文结束 感谢您的时间-------------

欢迎关注我的其它发布渠道