随机变量及其分布
分布函数
分布函数\(F_X(x)\)为随机变量X的分布函数 \[ F_X(x)=P(X\leq x) \] 性质
- 单调非降性:对任意的\(x_1<x_2\),\(F(x_1)\leq F(x_2)\)
- 右连续性:对任意的a,\(\lim\limits_{x\downarrow a}F(x)=F(a)\)
- 规范性:\(F(-\infty)=0,F(+\infty)=1\)
离散型随机变量
分布函数 \[ F(x)=P(X\leq x)=\sum_{x_i\leq x}p_i \]
常见的离散型分布
单点分布
\[ P(X=C)=1 \] ### 两点分布 \[ P(X=0)=1-p,P(X=1)=p \] ### 二项分布\(X\sim B(n,p)\) \[ p(X=k)=C_n^kp^k(1-p)^{n-k} \] \(P(X=[(n+1)p])\)为二项分布的中心项,递推式 \[ P(X=k)=\frac{(n-k+1)p}{kq}P(X=k-1) \]
泊松分布\(X\sim P(\lambda)\)
\[ P(X=k)=\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,... \]
当\(n\geq 20,p\leq 0.05\),取\(\lambda=np\),有如下近似公式 \[ C_n^kp^k(1-p)^{n-k}\approx\frac{\lambda^ke^{-\lambda}}{k!} \] 泊松分布的中心项\(P(X=[\lambda])\) \[ \frac{P(X=k)}{P(X=k-1)}=\frac{\lambda}{k},k>1 \]
超几何分布
\[ P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n},k=0,1,2,...,n \]
其中\(n\leq N,M\leq N\)
当N很大,n很小时,令\(p=\frac{M}{N}\) \[ \frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\approx C_n^kp^k(1-p)^{n-k} \]
几何分布
\[ P(X=k)=p(1-p)^{k-1},k=1,2,... \]
取自然数值的随机变量X服从几何分布的充要条件是X具有无记忆性: \[ P(X>m+n|X>m)=P(X>n),m,n\geq 1 \]
连续型随机变量
设随机变量X的分布函数\(F(X)\),若存在非负可积函数\(f(x)\),使得对任意实数\(x\),有 \[ F(x)=\int_{-\infty}^{x}f(t)dt \] 则称\(f(x)\)是X的概率密度 \[ P(a<X\leq b)=F(b)-F(a)=\int_a^bf(x)dx \]
常见的连续型分布
均匀分布\(X\sim U(a,b)\)
概率密度: \[ f(x)=\left\{\begin{matrix} \frac{1}{b-a}&a\leq x\leq b \\ 0&其他 \end{matrix}\right. \] 分布函数: \[ F(x)=\int_{-\infty}^{x}f(t)dt=\left\{\begin{matrix} 0 & x<a\\ \frac{x-a}{x-b} & a\leq x<b\\ 1&x\geq b \end{matrix}\right. \] 令\(Y=F(X)\) \[ P(Y<y)=P(F(X)<y)=P(X<F^{-1}(y))=F(F^{-1}(y))=y\\ P(Y\leq y)=\lim\limits_{n\to\infty}P(F(X)<y+\frac{1}{n})=\lim\limits_{n\to\infty}(y+\frac{1}{n})=y \]
指数分布\(X\sim E(\lambda)\)
概率密度: \[ f(x)=\left\{\begin{matrix} \lambda e^{-\lambda x}& x\geq0 \\ 0&x<0 \end{matrix}\right. \] 分布函数: \[ F(x)=\left\{\begin{matrix} 1-e^{-\lambda X} &x\geq 0 \\ 0&x<0 \end{matrix}\right. \] 取非负实数的随机变量X服从指数分布的充要条件是X具有无记忆性: \[ P(X>x+y|X>x)=P(X>y),x,y>0 \]
正态分布\(X\sim N(\mu,\sigma^2)\)
概率密度: \[ f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}},-\infty<x<+\infty \] 分布函数: \[ F(x)=\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infty}^{x}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt,-\infty<x<+\infty \] \(x=\mu\pm\sigma\)是\(f(x)\)的拐点,且当\(x\to\pm\infty\)时均以x轴为渐近线
标准正态分布:
若\(X\sim N(0,1)\),称X服从标准正态分布 \[ \Phi(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^xe^{-\frac{t^2}{2}}dt \]
- 对负的x有\(\Phi(-x)=1-\Phi(x)\)
- \(\Phi(u_a)=1-P(X>u_a)=1-a\)
- \(u_a=u_{1-a}\)
化成标准正态分布:
若\(X\sim N(\mu,\sigma^2)\),则 \[ F(x)=\Phi(\frac{X-\mu}{\sigma}) \]
随机变量函数的分布
离散型
列分布列即可
连续型
分布函数法
\[ F_Y(y)=P(Y\leq y)=P(g(X)\leq y)=\int_{g(X)\leq y}f_X(x)dx \]
对y求导得 \[ f_Y(y)=F_Y'(y) \]
公式法
假设\(y=g(x)\)是严格单调的函数,其反函数\(x=g^{-1}(y)\)有连续导数,则\(Y=g(X)\)也为连续型随机变量,且概率密度为 \[ f_Y(y)=\left\{\begin{matrix} f_X(g^{-1}(y))|[g^{-1}(y)'|&y\in(\alpha,\beta) \\ 0&其他 \end{matrix}\right. \] \((\alpha,\beta)\)为\(g(x)\)的值域
推论:
假设\(g(x)\)在不相重叠的区域\(I_1,I_2,...\)上逐段满足上述条件,且分别以\(g_i^{-1}(y),[g_i^{-1}(y)]'(i=1,2,...)\)记\(y=g(x)\)在各段上的反函数及其导数,则\(Y=g(X)\)也为连续型随机变量,且概率密度为 \[ f_Y(y)=\left\{\begin{matrix} \sum\limits_{i;y\in g(I_i)}f_X(g_i^{-1}(y))|[g_i^{-1}(y)'|&y\in(\alpha,\beta) \\ 0&其他 \end{matrix}\right. \]