# 总体与样本
# 理论分布 & 经验分布函数
# 理论分布
总体X 的分布称为理论分布,总体X 的分布函数称为理论分布函数
若总体X 的分布函数为F(x),(X1,X2,...,Xn) 是总体X 的容量为 n 的样本,则由样本独立同分布的性质知道(X1,X2,...,Xn) 的分布函数为
F(x1,x2,...,xn)=i=1∏nF(xi)
若总体X 是离散型:
P(X1=x1,X2=x2,...,Xn=xn)=i=1∏nP(xi)
若总体X 是连续型:
f(x1,x2,...,xn)=i=1∏nf(xi)
# 经验分布
设(X1,X2,...,Xn) 是总体X 的容量为 n 的样本,将其观测值(x1,x2,...,xn) 按从小到大的顺序排列为x1∗≤x2∗≤...≤xn∗,Fn(x) 为X 的经验分布函数:
Fn(x)=⎩⎪⎨⎪⎧0nk1x<x1∗xk∗≤x<xk+1∗(k=1,2,...,n−1)x≥xn∗
# Glivenko 定理
设总体X 的理论分布函数为F(x),经验分布函数为Fn(x),则当n→∞ 时,Fn(x) 以概率 1 关于 x 均匀收敛于F(x)
# 统计量 & 样本矩
设(X1,X2,...,Xn) 是取自总体X 的样本,g(x1,x2,...,xn) 为一连续函数,且 g 中不含任何未知参数,则称g(x1,x2,...,xn) 是统计量g(X1,X2,...,Xn) 的观测值
常用统计量:
样本均值:
Xˉ=n1i=1∑nXi
样本方差:
S2=n−11i=1∑n(Xi−Xˉ)2
样本 k 阶原点矩:
Ak=n1i=1∑nXik
样本 k 阶中心矩:
Bk=n1i=1∑n(Xi−Xˉ)k
中位数:
X={Xm+1∗21(Xm∗+Xm+1∗)n=2m+1n=2m
极差:
R=Xn∗−X1∗
# 抽样分布
# χ2 分布
设(X1,X2,...,Xn) 是正态总体N(0,1) 的样本,称统计量χ2=X12+X22+...+Xn2 所服从的分布为自由度是 n 的χ2 分布,记为χ2∼χ2(n)
性质:
-
χ2∼χ2(x),则Eχ2=n,Dχ2=2n
-
χ2 分布具有可加性,设χ12∼χ2(n1),χ22∼χ2(n2),且相互独立,则χ12+χ22∼χ2(n1+n2)
-
上侧α 分位点χα2(n),P(χ2>χα2(n))=α
-
当n 充分大时,2χ2 近似地服从正态分布N(2n−1,1)
当n>45 时,χα2(n) 可由近似公式χα2(n)≈21(uα+2n−1)2,其中Φ(uα)=1−α
# t 分布
设X∼N(0,1),Y∼χ2(n),且相互独立,则称随机变量T=Y/nX 所服从的分布为自由度是n 的t 分布,记为T∼t(n)
性质:
-
图像单峰对称,重尾分布(取值更分散)
-
n=1,f(x)=π(1+x2)1−−柯西分布n>1,E(T)=0
-
上侧α 分位点tα(n),P(T>tα(n))=α
当n>45 时,t_{\alpha}\approx u_
# F 分布
设X∼χ2(n1),Y∼χ2(n2),且相互独立,则称随机变量F=Y/n2X/n1 所服从的分布为自由度是(n1,n2) 的 F 分布,记为F∼F(n1,n2)
性质:
-
上侧α 分位点Fα(n1,n2),P(F>Fα(n1,n2))=α
-
若F∼F(n1,n2),则
F1∼F(n2,n1)F1−α(n1,n2)=Fα(n2,n1)1
# 正态总体的样本均值与样本方差的分布
设(X1,X2,...,Xn) 是取自正态总体N(μ,σ2) 的样本,Xˉ 和S2 分别为样本均值和样本方差,则
-
Xˉ 和S2 独立
-
Xˉ∼N(μ,nσ2)
-
(n−1)σ2S2∼χ2(n−1)
-
T=S/nXˉ−μ∼t(n−1)
设(X1,X2,...,Xn) 和(Y1,Y2,...,Yn) 分别是取自两个相互独立的正态总体N(μ1,σ12) 和N(μ2,σ22) 两个样本,其样本方差分别记为S12 和S22,则
-
F=S22/σ22S12/σ12∼F(n1−1,n2−1)
-
n21i=1∑n2(σ2Xi−μ2)2n11i=1∑n1(σ1Xi−μ1)2∼F(n1,n2)
-
T=Sw(Xˉ−Yˉ)−(μ1−μ2)n1+n2n1n2∼t(n1+n2−2)其中Sw=n1+n2−2(n1−1)S12+(n2−1)S22