概率论 – 期中复习

第一至四章

随机事件与概率

多事件独立性

独立性推广——三事件

设A、B、C是三个随机事件,如果满足

{P(AB)=P(A)P(B)P(BC)=P(B)P(C)P(AC)=P(A)P(C)P(ABC)=P(A)P(B)P(C)\left\{\begin{array}{c} P(A B)=P(A) P(B) \\ P(B C)=P(B) P(C) \\ P(A C)=P(A) P(C) \\ P(A B C)=P(A) P(B) P(C) \end{array}\right.

则称A、B、C是相互独立的随机事件

注意:
在三个事件独立性的定义中,四个等式是缺一不可的.即:前三个等式的成立不能推出第四个等式的成立;反之,最后一个等式的成立也推不出前三个等式的成立.

独立性推广——n事件

设A1,A2,…,A𝑛是n个随机事件,如果满足
{P(Ai Aj)=P(Ai)P(Aj)(1i<jn)P(Ai AjAk)=P(Ai)P(Aj)P(Ak)(1i<j<kn)  P(A1 A2An)=P(A1)P(A2)(An)\left\{\begin{array}{cc} \mathrm{P}\left(\mathrm{A}_{i} \mathrm{~A}_{\mathrm{j}}\right)=\mathrm{P}\left(\mathrm{A}_{i}\right) \mathrm{P}\left(\mathrm{A}_{j}\right) & (1 \leq i<j \leq n) \\ \mathrm{P}\left(\mathrm{A}_{i} \mathrm{~A}_{\mathrm{j}} \mathrm{A}_{k}\right)=\mathrm{P}\left(\mathrm{A}_{i}\right) \mathrm{P}\left(\mathrm{A}_{j}\right) \mathrm{P}\left(\mathrm{A}_{k}\right) & (1 \leq i<j<k \leq n) \\ \ldots\ \ldots & \ldots\ \ldots\\ \mathrm{P}\left(\mathrm{A}_{1} \mathrm{~A}_{2} \ldots \mathrm{A}_{n}\right)=\mathrm{P}\left(\mathrm{A}_{1}\right) \mathrm{P}\left(\mathrm{A}_{2}\right) \ldots\left(\mathrm{A}_{n}\right) \end{array}\right.
则称A1,A2,…,A𝑛 是n个相互独立的随机事件

注意上面第i行有𝐶𝑛𝑖+1𝐶_𝑛^{𝑖+1}个等式,
共有Cn2+Cn3++Cnn=2nCn0Cn1=2nn1C_{n}^{2}+C_{n}^{3}+\cdots+C_{n}^{n}=2^{n}-C_{n}^{0}-C_{n}^{1}=2^{n}-n-1个等式

随机变量及其分布

随机变量

随机变量XX是样本空间SS上的函数
X=X(ω),(ωS)X=X(\omega),(\omega\in S)

常见离散型随机变量分布

Bernoulli 分布 / 0-1 分布

XB(1,p)P{X=k}=pkq1kE(X)=pD(X)=p(1p)\begin{gather*} X\sim B(1,p)\\ P\{X=k\}=p^kq^{1-k}\\ E(X)=p\\ D(X)=p(1-p) \end{gather*}

二项分布

XB(n,p)P{X=k}=Cnkpk(1p)nkE(X)=npD(X)=np(1p)\begin{gather*} X\sim B(n,p)\\ P\{X=k\}=C_{n}^{k} p^{k}(1-p)^{n-k}\\ E(X)=np\\ D(X)=np(1-p) \end{gather*}

二项分布的最大可能次数 k0k_0

P{X=k}P{X=k1}={>1,k<(n+1)p=1,k=(n+1)p<1,k>(n+1)p\frac{P\{X=k\}}{P\{X=k-1\}}= \begin{cases}>1, & k<(n+1) p \\ =1, & k=(n+1) p \\ <1, & k>(n+1) p\end{cases}
(𝑛+1)𝑝是整数,则𝑘0=(𝑛+1)𝑝𝑛+1𝑝1(𝑛+1)𝑝不是整数,则𝑘0=[(𝑛+1)𝑝]若(𝑛+1)𝑝是整数,则𝑘_0=(𝑛+1)𝑝或𝑛+1𝑝−1\\ 若(𝑛+1)𝑝不是整数,则𝑘_0=[(𝑛+1)𝑝]

Poisson 分布

Xπ(λ)P{X=k}=λkk!eλE(X)=λD(X)=λ\begin{gather*} X\sim \pi(\lambda)\\ P\{X=k\}=\frac{\lambda^{k}}{k !} e^{-\lambda}\\ E(X)=\lambda\\ D(X)=\lambda \end{gather*}

Poisson 定理


XnB(n,pn)limnnpn=λ>0\begin{gather*} X_n\sim B(n,p_n)\\ \lim_{n\rightarrow\infty}np_n=\lambda>0 \end{gather*}

limnP{Xn=k}=limnCnkpnk(1pn)nk=λkk!eλ\begin{gather*} \lim _{n \rightarrow \infty} P\left\{X_{n}=k\right\}=\lim _{n \rightarrow \infty} C_{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k}}{k !} e^{-\lambda} \end{gather*}

几何分布

XG(p)P{X=k}=(1p)k1pE(X)=1p\begin{gather*} X\sim G(p)\\ P\{X=k\}=(1-p)^{k-1}p\\ E(X)=\frac{1}{p} \end{gather*}

超几何分布

P{X=k}=CMkCNMnkCNn\begin{gather*} P\{X=k\}=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n} \end{gather*}
N 件产品中 M 个次品,抽 n 个恰好含 k 个次品的概率。

分布函数 F(x)

F(x)=P{Xx}F(x)=P\{X\le x\}
性质:

  1. 不减
  2. 0F(x)1F()=0F()=10\le F(x)\le1\\F(-\infty)=0\\F(\infty)=1
  3. 右连续F(x+0)=F(x)F(x+0)=F(x)

概率密度 f(x)

充要条件:

  1. 非负性f(x)>0f(x)>0
  2. 归一化f(x) dx=1\int_{-\infty}^{\infty}f(x)~\mathbf{d}x=1

连续型随机变量

定义

如果对于随机变量 X 的分布函数𝐹(𝑥),存在非负实函数𝑓(𝑥),使得对于任意实数𝑥,有
F(x)=xf(t)dtF(x)=\int_{-\infty}^{x} f(t) d t
则称 𝑋 为连续型随机变量,其中函数 𝑓(𝑥) 称为 𝑋 的概率密度函数, 简称概率密度或密度函数。

注意点

连续型随机变量取任一指定值的概率为0

𝑃(𝐴)=0,并不意味着𝐴=∅
𝑃(𝐵)=1,并不意味着𝐵=Ω

常见连续型随机变量分布

均匀分布

XU[a,b]E(X)=a+b2D(X)=(ba)212\begin{gather*} X\sim U[a,b]\\ E(X)=\frac{a+b}{2}\\ D(X)=\frac{(b-a)^2}{12} \end{gather*}

指数分布

XE(λ)f(x)={λeλxx>00x0F(x)={0,x01eλx,x>0E(X)=1λD(X)=1λ2\begin{gather*} X\sim E(\lambda)\\ f(x)=\left\{\begin{array}{cc} \lambda e^{-\lambda x} & x>0 \\ 0 & x \leq 0 \end{array}\right.\\ F(x)=\left\{\begin{array}{cc} 0, & x \leq 0 \\ 1-e^{-\lambda x}, & x>0 \end{array}\right.\\ E(X)=\frac{1}{\lambda}\\ D(X)=\frac{1}{\lambda^2} \end{gather*}

正态分布

XN(μ,σ2)\begin{gather*} X\sim N(\mu,\sigma^2)\\ \end{gather*}

标准正态分布

μ=0,σ=1\mu=0,\sigma=1
密度函数和分布函数用φ(𝑥)\varphi(𝑥)Φ(𝑥)\Phi(𝑥)表示

3σ3\sigma准则

XN(μ,σ),P(Xμσ)=0.6826P(Xμ2σ)=0.9544P(Xμ3σ)=0.9974\begin{gather*} X\sim N(\mu,\sigma)时,\\ \begin{gathered} P(|X-\mu| \leq \sigma)=0.6826 \\ P(|X-\mu| \leq 2 \sigma)=0.9544 \\ P(|X-\mu| \leq 3 \sigma)=0.9974 \end{gathered} \end{gather*}

Γ\Gamma分布

XΓ(r,λ)r>0,形状参数λ>0,尺度参数f(x)={λrΓ(r)xr1eλxx>00x0\begin{gather*} X\sim\Gamma(r,\lambda)\\ r>0,形状参数\\ \lambda>0,尺度参数\\ f(x)=\left\{\begin{array}{cl} \frac{\lambda^{r}}{\Gamma(r)} x^{r-1} e^{-\lambda x} & x>0 \\ 0 & x \leq 0 \end{array}\right. \end{gather*}

r=1r=1,参数为𝜆的指数分布

f(x)={λeλxx>00x0f(x)=\left\{\begin{array}{cc} \lambda e^{-\lambda x} & x>0 \\ 0 & x \leq 0 \end{array}\right.

r=nr=n,Erlang 分布

f(x)={λn(n1)!xn1eλxx>00x0f(x)=\left\{\begin{array}{cl} \frac{\lambda^{n}}{(n-1) !} x^{n-1} e^{-\lambda x} & x>0 \\ 0 & x \leq 0 \end{array}\right.

𝑟=𝑛/2,λ=1/2𝑟=𝑛/2, \lambda=1/2,自由度为nnχ2\chi^2-分布,

Xχ2(n)f(x)={12n2Γ(n2)xn21ex2x>00x0XN(0,1)X2χ2(1)\begin{gather*} X\sim\chi^2(n)\\ f(x)=\left\{\begin{array}{cl} \frac{1}{2^{\frac{n}{2}} \Gamma\left(\frac{n}{2}\right)} x^{\frac{n}{2}-1} e^{-\frac{x}{2}} & x>0 \\ 0 & x \leq 0 \end{array}\right. \\ X\sim N(0,1)\Rightarrow X^2\sim \chi^2(1) \end{gather*}

严格单调函数的分布

定理 设随机变量 XX 具有概率密度
fX(x),(<x<),f_{X}(x),(-\infty<x<\infty),
又设 g(x)g(x) 处处可导,且恒有 g(x)>0g^{\prime}(x)>0 (或 <0<0 ),
Y=g(X)Y=g(X) 是连续型随机变量,其概率密度为 fY(y)={fX[h(y)]h(y),α<y<β0, otherwise f_{Y}(y)=\left\{\begin{array}{cc}f_{X}[h(y)]\left|h^{\prime}(y)\right|, & \alpha<y<\beta \\ 0, & \text { otherwise }\end{array}\right.
其中 h(y)h(y)g(x)g(x) 的反函数,即
x=g1(y)=h(y)x=g^{-1}(y)=h(y)α=min{g(),g(+)},β=max{g(),g(+)}\alpha=\min \{g(-\infty), g(+\infty)\}, \beta=\max \{g(-\infty), g(+\infty)\}

补充定理(分段单调):
g(x)g(x) 在不相叠的区间 I1,I2,I_{1}, I_{2}, \ldots 上逐段严格单调,其反函数分别为 h1(x),h2(x),h_{1}(x), h_{2}(x), \ldots 均为连续函数,那么 Y=g(x)Y=g(x) 是连续型随机变量,其概率密度为
fY(y)=fX[h1(y)]h1(y)+fX[h2(y)]h2(y)+,y(α,β)\begin{gathered} f_{Y}(y)=f_{X}\left[h_{1}(y)\right]\left|h_{1}^{\prime}(y)\right|+f_{X}\left[h_{2}(y)\right]\left|h_{2}^{\prime}(y)\right|+\cdots, \\ y \in(\alpha, \beta) \end{gathered}

多维随机变量及其分布

二维随机变量的联合分布函数 F(x,y)

充要条件:

  1. 单调
  2. 有界:0F(x,y)10\le F(x,y)\le 1
    x,F(x,)=0y,F(,y)=0F(,)=0F(,)=1\forall x,F(x,-\infty)=0\\\forall y,F(-\infty,y)=0\\F(-\infty,-\infty)=0\\F(\infty,\infty)=1
  3. 右连续
  4. 非负性:若 x1<x2,y1<y2x_{1}<x_{2}, y_{1}<y_{2}, 则 F(x2,y2)+F(x1,y1)F(x2,y1)F(x1,y2)0F\left(x_{2}, y_{2}\right)+F\left(x_{1}, y_{1}\right)-F\left(x_{2}, y_{1}\right)-F\left(x_{1}, y_{2}\right) \geq 0

多元正态分布

fx(x1,,xk)=1(2π)kΣe12(xμ)TΣ1(xμ)f_{\mathbf{x}}\left(x_{1}, \ldots, x_{k}\right)=\frac{1}{\sqrt{(2 \pi)^{k}|\boldsymbol{\Sigma}|}} \mathrm{e}^{-\frac{1}{2}(\mathbf{x}-\boldsymbol{\mu})^{\mathrm{T}} \boldsymbol{\Sigma}^{-1}(\mathbf{x}-\boldsymbol{\mu})}

边缘分布

FX(x)=F(X,+)=xfX(x) dxfX(x)=+f(x,y) dyF_X(x)=F(X,+\infty)=\int_{-\infty}^xf_X(x)~\mathbf{d}x\\ f_X(x)=\int_{-\infty}^{+\infty}f(x,y)~\mathbf{d}y

条件分布

FXY(xy)=P{X<xY=y}=limϵ0P{Xxy<Yy+ϵ}=limϵ0P{Xx,y<Yy+ϵ}P{y<Yy+ϵ}=limε0+F(x,y+ε)F(x,y)FY(y+ε)FY(y)=yF(x,y)yFY(y)=xf(u,y)fY(y)dufXY(xy)=f(x,y)fY(y)\begin{aligned}F_{X|Y}(x|y)&=P\{X<x|Y=y\}\\ &=\lim _{\epsilon \rightarrow 0} P\{X \leq x \mid y<Y \leq y+\epsilon\}\\ &=\lim _{\epsilon \rightarrow 0} \frac{P\{X \leq x, y<Y \leq y+\epsilon\}}{P\{y<Y \leq y+\epsilon\}}\\ &=\lim _{\varepsilon \rightarrow 0^{+}} \frac{F(x, y+\varepsilon)-F(x, y)}{F_{Y}(y+\varepsilon)-F_{Y}(y)}\\ &=\frac{\frac{\partial}{\partial y} F(x, y)}{\frac{\partial}{\partial y} F_{Y}(y)} \\ &=\int_{-\infty}^{x} \frac{f(u, y)}{f_{Y}(y)} d u \end{aligned}\\ f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}

几何上的解释

f(x,y)=fXY(xy)fY(y)f(x,y)=f_{X|Y}(x|y)f_Y(y)
可以看作是利用边缘分布对条件分布进行了调制

二维随机变量函数的分布

Z=X+Y

fZ(z)=f(zy,y)dy=f(x,zx)dxf_{Z}(z)=\int_{-\infty}^{\infty} f(z-y, y) d y=\int_{-\infty}^{\infty} f(x, z-x) d x
当X,Y相互独立时,
fZ=fXfYf_Z=f_X*f_Y
推论:有限个相互独立的正态随机变量的线性组合仍然服从正态分布
XiN(μi,σi2)(i=1,2,,n)X_{i} \sim N\left(\mu_{i}, \sigma_{i}^{2}\right)(i=1,2, \ldots, n) , 且相互独立, Z=i=1nXiZ=\sum_{i=1}^{n} X_{i}
ZN(i=1nμi,i=1nσi2)Z \sim N\left(\sum_{i=1}^{n} \mu_{i}, \sum_{i=1}^{n} \sigma_{i}^{2}\right)

Z=Y/X

fY/X(z)=xf(x,xz)dxf_{Y / X}(z)=\int_{-\infty}^{\infty}|x| f(x, x z) d x

Z=XY

fXY(z)=1xf(x,zx)dxf_{X Y}(z)=\int_{-\infty}^{\infty}\left|\frac{1}{x}\right| f\left(x, \frac{z}{x}\right) d x

max{X,Y}

Fmax(X,Y)(z)=FX(z)FY(z)F_{\max (X, Y)}(z)=F_{X}(z) F_{Y}(z)

min{X,Y}

Fmin(X,Y)(z)=1[1FX(z)][1FY(z)]F_{\min (X, Y)}(z)=1-\left[1-F_{X}(z)\right]\left[1-F_{Y}(z)\right]

随机变量的数字特征

期望

E(X)=x dF(x)E(X)=\int x~\mathbf{d}F(x)

方差

D(X)=[xE(X)]2 dF(x)D(X)=\int [x-E(X)]^2~\mathbf{d}F(x)

样本均值

Xˉn=1ni=1nXiE(Xˉn)=μ,D(Xˉn)=σ2n\bar{X}_{n}=\frac{1}{n} \sum_{i=1}^{n} X_{i} \\ E\left(\bar{X}_{n}\right)=\mu, \quad D\left(\bar{X}_{n}\right)=\frac{\sigma^{2}}{n}

样本方差

Sn2=1n1i=1n(XiXˉn)2E(Sn2)=σ2S_{n}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}\left(X_{i}-\bar{X}_{n}\right)^{2}\\ E\left(S_{n}^{2}\right)=\sigma^{2}

Chebyshev 不等式

P{Xμϵ}σ2ϵ2( 等价地: P{Xμ<ϵ}1σ2ϵ2)\begin{gathered} P\{|X-\mu| \geq \epsilon\} \leq \frac{\sigma^{2}}{\epsilon^{2}} \\ \left(\text { 等价地: } P\{|X-\mu|<\epsilon\} \geq 1-\frac{\sigma^{2}}{\epsilon^{2}}\right) \end{gathered}
证明:
P{Xμϵ}=xμϵf(x)dxxμϵxμ2ϵ2f(x)dx1ϵ2+(xμ)2f(x)dx=σ2ϵ2\begin{aligned} P\{\mid X&-\mu \mid \geq \epsilon\} \\ &=\int_{|x-\mu| \geq \epsilon} f(x) d x \leq \int_{|x-\mu| \geq \epsilon} \frac{|x-\mu|^{2}}{\epsilon^{2}} f(x) d x \\ & \leq \frac{1}{\epsilon^{2}} \int_{-\infty}^{+\infty}(x-\mu)^{2} f(x) d x \\ &=\frac{\sigma^{2}}{\epsilon^{2}} \end{aligned}

协方差

Cov(𝑋,𝑌)=𝐸[𝑋𝐸(𝑋)][𝑌𝐸(𝑌)]Cov(𝑋,𝑌)= 𝐸{[𝑋−𝐸(𝑋)][𝑌−𝐸(𝑌)]}

性质

Cov(𝑋,𝑌)=𝐸(𝑋𝑌)𝐸(𝑋)𝐸(𝑌)D(X+Y)=D(X)+D(Y)+2Cov(𝑋,𝑌)Cov(𝑋,𝑌)=𝐸(𝑋𝑌)−𝐸(𝑋)𝐸(𝑌)\\ D(X+Y)=D(X)+D(Y)+2Cov(𝑋,𝑌)

标准协方差 / 相关系数

ρXY=Cov(X,Y)D(X)D(Y)\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sqrt{D(X)} \sqrt{D(Y)}}

注意:

是否相关只是针对线性关系而言的,X与Y相互独立则是相对一般关系而言的

(X1,X2,,Xn)\left(X_{1}, X_{2}, \ldots, X_{n}\right) 服从n维正态分布,则 X1,X2,,XnX_{1}, X_{2}, \ldots, X_{n} 相互独立 X1,X2,,Xn\Leftrightarrow X_{1}, X_{2}, \ldots, X_{n} 两两不相关

E(Xk)Xk阶原点矩E{[XE(X)]k}Xk阶中心矩E(XkYl)XYk+l阶混合矩E{[XE(X)]k[YE(Y)]l}XYk+l阶中心矩\begin{align*} E(X^k)\quad&X的k阶原点矩\\ E\{[X-E(X)]^k\}\quad&X的k阶中心矩\\ E(X^kY^l)\quad&X和Y的k+l阶混合矩\\ E\{[X-E(X)]^k[Y-E(Y)]^l\}\quad&X和Y的k+l阶中心矩 \end{align*}

发表评论

%d 博主赞过: