# 多维随机变量

联合分布函数

F(x,y)=P(Xx,Yy)F(x,y)=P(X\leq x,Y\leq y)

边缘分布函数

FX(x)=F(x,+)F_X(x) = F(x,+\infty)

FY(y)=F(+,y)F_Y(y) =F(+\infty,y)

# 离散型

pi0p_{i\cdot}\neq0pj0p_{\cdot j}\neq0 时我们可以由条件概率的乘积公式计算p_

# 连续型

若存在二元非负函数f(x,y)f(x,y) 使得二维随机变量(X,Y)(X,Y) 的分布函数

F(x,y)=xyf(u,v)dudvF(x,y)=\int_{-\infty}^{x}\int_{-\infty}^yf(u,v)dudv

则称(X,Y)(X,Y) 为一二维连续型随机变量,f(x,y)f(x,y)(X,Y)(X,Y) 的联合概率密度

边缘概率密度:

fX(x)=+f(x,y)dyf_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy

fY(y)=+f(x,y)dxf_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx

# 常用二维连续型随机变量

# 二维均匀分布(X,Y)U(D)(X,Y)\sim U(D)

DR2D\subset R^2,且面积0<m(D)<+0<m(D)<+\infty,则称具有概率密度

f(x,y)={1/m(D)(x,y)D0(x,y)∉Df(x,y)=\left\{\begin{matrix} 1/m(D) &(x,y)\in D \\ 0&(x,y)\not\in D \end{matrix}\right.

多维均匀分布的边缘分布不一定是一维均匀分布

# 二维正态分布(X,Y)N(μ1,μ2,σ12,σ22,ρ)(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)

密度:

f(x)=12πσ1σ21ρ2exp(12(1ρ2)((xμ1)2σ122ρ(xμ1)(yμ2)σ1σ2+(yμ2)2σ22))f(x) = \frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1 - \rho^2}} \exp\left(-\frac{1}{2(1 - \rho^2)} \left( \frac{(x - \mu_1)^2}{\sigma_1^2} - \frac{2\rho (x - \mu_1)(y - \mu_2)}{\sigma_1 \sigma_2} + \frac{(y - \mu_2)^2}{\sigma_2^2} \right)\right)

边缘分布:

XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2)

YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2)

多维正态分布的边缘分布仍为正态分布

# 条件分布

# 离散型

直接用条件概率求解即可

# 连续型

已知X=xX=x 时 Y 的条件概率密度:

f(yx)=f(x,y)fX(x)f(y|x)=\frac{f(x,y)}{f_X(x)}

全概率公式:

fY(y)=+fX(x)f(yx)dxf_Y(y)=\int_{-\infty}^{+\infty}f_X(x)f(y|x)dx

fX(x)=+fY(y)f(xy)dyf_X(x)=\int_{-\infty}^{+\infty}f_Y(y)f(x|y)dy

(x,y)N(μ1,μ2,σ12,σ12,ρ)(x,y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_1^2,\rho),则在已知Y=yY=y 的条件下,X 服从正态分布

N(μ1+σ1σ2ρ(xμ1),(1ρ2)σ22)N(\mu_1+\frac{\sigma_1}{\sigma_2}\rho(x-\mu_1),(1-\rho^2)\sigma_2^2)

# 随机变量的独立性

  1. (X1,X2,...,Xn)(X_1,X_2,...,X_n) 为连续型随机变量,则X1,X2,...,XnX_1,X_2,...,X_n 相互独立当且仅当

    f(x1,x2,...,xn)=i=1nfXi(xi)f(x_1,x_2,...,x_n)=\prod_{i=1}^{n}f_{X_i}(x_i)

  2. X1,X2,...,XnX_1,X_2,...,X_n 相互独立,则对于 n 个函数g1,g2,...,gng_1,g_2,...,g_ng1(X1),g2(X2),...,gn(Xn)g_1(X_1),g_2(X_2),...,g_n(X_n) 相互独立

对于二维正态分布(x,y)N(μ1,μ2,σ12,σ12,ρ)(x,y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_1^2,\rho)X,YX,Y 独立的充分必要条件是ρ=0\rho=0

# 多维随机变量函数的分布

# 离散型

直接计算其分布列即可

实例

X,YX,Y 独立,XB(m,p)X\sim B(m,p)YB(n,p)Y\sim B(n,p),则

X+Y(m+n,p)X+Y\sim(m+n,p)

# 连续型

先求分布函数,如果 Y 为一连续随机变量,则求导得其概率密度

# 和的分布

(X,Y)(X,Y) 的联合密度为f(x,y)f(x,y)Z=X+YZ=X+Y,积分区域为x+yzx + y\leq z,则 Z 的分布函数为

FZ(z)=+dyzyf(x,y)dxF_Z(z)=\int_{-\infty}^{+\infty}dy\int_{-\infty}^{z-y}f(x,y)dx

概率密度:

fZ(z)=+f(x,zx)dx=+f(zy,y)dyf_Z(z)=\int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy

X,YX,Y 独立

fZ(z)=+fX(x)fY(zx)dx=+fX(zy)fY(y)dyf_Z(z)=\int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx=\int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy

实例

X1,...,XnX_1,...,X_n 相互独立,且XiN(ui,σi2)X_i\sim N(\,u_i,\sigma_i^2),则

i=1naiXiN(i=1naiμi,i=1nai2σi2)\sum_{i=1}^{n}a_iX_i\sim N(\sum_{i=1}^{n}a_i\mu_i,\sum_{i=1}^{n}a_i^2\sigma_i^2)

X_1-X_2\sim N(\mu_1-\mu_2,\sigma_1^2{\color\red{+}}\sigma_2^2)

XP(λ1),YP(λ2)X\sim P(\lambda_1),Y\sim P(\lambda_2)

X+YP(λ1+λ2)X+Y\sim P(\lambda_1+\lambda_2)

# 商的分布

fZ(z)=+yf(yz,y)dyf_Z(z)=\int_{-\infty}^{+\infty}|y|f(yz, y)dy

# 最大最小值分布