# 分布函数

分布函数FX(x)F_X(x) 为随机变量 X 的分布函数

FX(x)=P(Xx)F_X(x)=P(X\leq x)

性质

  1. 单调非降性:对任意的x1<x2x_1<x_2F(x1)F(x2)F(x_1)\leq F(x_2)
  2. 右连续性:对任意的 a,limxaF(x)=F(a)\lim\limits_{x\downarrow a}F(x)=F(a)
  3. 规范性:F()=0,F(+)=1F(-\infty)=0,F(+\infty)=1

# 离散型随机变量

分布函数

F(x)=P(Xx)=xixpiF(x)=P(X\leq x)=\sum_{x_i\leq x}p_i

# 常见的离散型分布

# 单点分布

P(X=C)=1P(X=C)=1

# 两点分布

P(X=0)=1p,P(X=1)=pP(X=0)=1-p,P(X=1)=p

# 二项分布XB(n,p)X\sim B(n,p)

p(X=k)=Cnkpk(1p)nkp(X=k)=C_n^kp^k(1-p)^{n-k}

P(X=[(n+1)p])P(X=[(n+1)p]) 为二项分布的中心项,递推式

P(X=k)=(nk+1)pkqP(X=k1)P(X=k)=\frac{(n-k+1)p}{kq}P(X=k-1)

# 泊松分布XP(λ)X\sim P(\lambda)

P(X=k)=λkeλk!,k=0,1,2,...P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,...

n20,p0.05n\geq 20,p\leq 0.05,取λ=np\lambda=np,有如下近似公式

Cnkpk(1p)nkλkeλk!C_n^kp^k(1-p)^{n-k}\approx\frac{\lambda^ke^{-\lambda}}{k!}

泊松分布的中心项P(X=[λ])P(X=[\lambda])

P(X=k)P(X=k1)=λk,k>1\frac{P(X=k)}{P(X=k-1)}=\frac{\lambda}{k},k>1

# 超几何分布

P(X=k)=CMkCNMnkCNn,k=0,1,2,...,nP(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,2,...,n

其中nN,MNn\leq N,M\leq N

当 N 很大,n 很小时,令p=\frac{M}

CMkCNMnkCNnCnkpk(1p)nk\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\approx C_n^kp^k(1-p)^{n-k}

# 几何分布

P(X=k)=p(1p)k1,k=1,2,...P(X=k)=p(1-p)^{k-1},k=1,2,...

取自然数值的随机变量 X 服从几何分布的充要条件是 X 具有无记忆性:

P(X>m+nX>m)=P(X>n),m,n1P(X>m+n|X>m)=P(X>n),m,n\geq 1

# 连续型随机变量

设随机变量 X 的分布函数F(X)F(X),若存在非负可积函数f(x)f(x),使得对任意实数xx,有

F(x)=xf(t)dtF(x)=\int_{-\infty}^{x}f(t)dt

则称f(x)f(x) 是 X 的概率密度

P(a<Xb)=F(b)F(a)=abf(x)dxP(a<X\leq b)=F(b)-F(a)=\int_a^bf(x)dx

# 常见的连续型分布

# 均匀分布XU(a,b)X\sim U(a,b)

概率密度

f(x)={1baaxb0其他f(x)=\left\{\begin{matrix} \frac{1}{b-a}&a\leq x\leq b \\ 0&其他 \end{matrix}\right.

分布函数

F(x)=xf(t)dt={0x<axaxbax<b1xbF(x)=\int_{-\infty}^{x}f(t)dt=\left\{\begin{matrix} 0 & x<a\\ \frac{x-a}{x-b} & a\leq x<b\\ 1&x\geq b \end{matrix}\right.

Y=F(X)Y=F(X)

P(Y<y)=P(F(X)<y)=P(X<F1(y))=F(F1(y))=yP(Yy)=limnP(F(X)<y+1n)=limn(y+1n)=yP(Y<y)=P(F(X)<y)=P(X<F^{-1}(y))=F(F^{-1}(y))=y\\ P(Y\leq y)=\lim\limits_{n\to\infty}P(F(X)<y+\frac{1}{n})=\lim\limits_{n\to\infty}(y+\frac{1}{n})=y

# 指数分布XE(λ)X\sim E(\lambda)

概率密度

f(x)={λeλxx00x<0f(x)=\left\{\begin{matrix} \lambda e^{-\lambda x}& x\geq0 \\ 0&x<0 \end{matrix}\right.

分布函数

F(x)={1eλXx00x<0F(x)=\left\{\begin{matrix} 1-e^{-\lambda X} &x\geq 0 \\ 0&x<0 \end{matrix}\right.

取非负实数的随机变量 X 服从指数分布的充要条件是 X 具有无记忆性:

P(X>x+yX>x)=P(X>y),x,y>0P(X>x+y|X>x)=P(X>y),x,y>0

# 正态分布XN(μ,σ2)X\sim N(\mu,\sigma^2)

概率密度

f(x)=12πσe(xμ)22σ2,<x<+f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty

分布函数

F(x)=12πσxe(tμ)22σ2dt,<x<+F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt,-\infty<x<+\infty

x=μ±σx=\mu\pm\sigmaf(x)f(x) 的拐点,且当x±x\to\pm\infty 时均以 x 轴为渐近线

标准正态分布:

XN(0,1)X\sim N(0,1),称 X 服从标准正态分布

Φ(x)=12πxet22dt\Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt

  1. 对负的 x 有Φ(x)=1Φ(x)\Phi(-x)=1-\Phi(x)
  2. Φ(ua)=1P(X>ua)=1a\Phi(u_a)=1-P(X>u_a)=1-a
  3. u_a=u_

化成标准正态分布

XN(μ,σ2)X\sim N(\mu,\sigma^2),则

F(x)=Φ(Xμσ)F(x)=\Phi(\frac{X-\mu}{\sigma})

# 随机变量函数的分布

# 离散型

列分布列即可

# 连续型

# 分布函数法

FY(y)=P(Yy)=P(g(X)y)=g(X)yfX(x)dxF_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{g(X)\leq y}f_X(x)dx

对 y 求导得

fY(y)=FY(y)f_Y(y)=F_Y'(y)

# 公式法

假设y=g(x)y=g(x) 是严格单调的函数,其反函数x=g1(y)x=g^{-1}(y) 有连续导数,则Y=g(X)Y=g(X) 也为连续型随机变量,且概率密度为

fY(y)={fX(g1(y))[g1(y)y(α,β)0其他f_Y(y)=\left\{\begin{matrix} f_X(g^{-1}(y))|[g^{-1}(y)'|&y\in(\alpha,\beta) \\ 0&其他 \end{matrix}\right.

(α,β)(\alpha,\beta)g(x)g(x) 的值域

推论

假设g(x)g(x) 在不相重叠的区域I1,I2,...I_1,I_2,... 上逐段满足上述条件,且分别以gi1(y),[gi1(y)](i=1,2,...)g_i^{-1}(y),[g_i^{-1}(y)]'(i=1,2,...)y=g(x)y=g(x) 在各段上的反函数及其导数,则Y=g(X)Y=g(X) 也为连续型随机变量,且概率密度为

fY(y)={i;yg(Ii)fX(gi1(y))[gi1(y)y(α,β)0其他f_Y(y)=\left\{\begin{matrix} \sum\limits_{i;y\in g(I_i)}f_X(g_i^{-1}(y))|[g_i^{-1}(y)'|&y\in(\alpha,\beta) \\ 0&其他 \end{matrix}\right.