# 参数估计概念
通常将总体参数的函数和总体数字特征统称为总体参数。参数估计问题就是利用样本对上述各类总体未知参数做出估计。
参数估计分为两种:点估计和区间估计
点估计:用一个数值来估计某个未知参数
设总体X 的参数θ(θ 可为向量),记θ 的所有可能取值所成的集合为参数空间Θ,用总体样本(X1,X2,...,Xn) 构造统计量θ^=θ^(X1,X2,...,Xn) 来估计θ
区间估计:对总体的待估参数,获得其值所在的一个范围,以一给定的概率相信该范围包含了该参数
# 矩估计法和极大似然估计法
# 矩估计法
以样本原点矩作为对应的总体原点矩的估计量,以样本原点矩的连续函数作为对应的总体原点矩的连续函数的估计量
矩估计法步骤:
设总体X 是概率密度为f(x;θ1,...,θk) 的连续型随机变量,或总体X 是分布列位P(X=x)=f(x;θ1,...,θk) 的离散型随机变量,其中θ1,...,θk 为待估参数
总体X 的j 阶矩为
αj=E(Xj)=∫−∞+∞xjf(x;θ1,...,θk)dx,(j=1,2,...,k)
或
αj=E(Xj)=∑xjf(x;θ1,...,θk),(j=1,2,...,k)
设(X1,X2,...,Xn) 为取自总体X 的样本,相应的样本j 阶原点矩为
Aj=n1i=1∑nXij,(j=1,2,...,k)
令X 的j 阶总体矩等于对应的样本矩,得k 个方程
αj(θ1,...,θk)=Aj
上述方程的解作为未知数θ1,...,θk 的估计量
-
对任何总体而言,只要其期望、方差存在,则总体期望的矩估计为样本均值X,总体方差的矩估计为样本二阶中心矩\widetilde
- 可推广到:总体的k 阶中心矩的矩估计是对应的样本k 阶中心矩
-
事件发生概率的矩估计是事件发生的频率
# 极大似然估计法
设总体X 的概率密度为f(x;θ),当X 为离散型时,f(x;θ)=P(X=x;θ),(x1,..,xn) 是总体样本X1,...,Xn 的一组观察值
似然函数:
L(θ)=L(x1,x2,...,xn;θ)=i=1∏nf(xi;θ)
极大似然估计:
若存在θ^=θ^(x1,x2,...,xk),使得
L(x1,x2,...,xk;θ^)=θ∈ΘmaxL(x1,x2,...,xk;θ)
则称
θ^=θ^(x1,x2,...,xn)=(θ^1(x1,x2,...,xn),...,θ^k(x1,x2,...,xn))
为θ 的极大似然估计量
极大似然估计值:
θ^=θ^(X1,X2,...,Xn)=(θ^1(X1,X2,...,Xn),...,θ^k(X1,X2,...,Xn))
若f(x,θ) 关于θ 可微,θ^ 可由方程①解得
∂θi∂L(θ)=0或∂θiln∂L(θ)=0−−①
若u=u(θ) 有唯一的反函数,且θ^ 是θ 的极大似然估计量,则u(θ^) 是u(θ) 的极大似然估计量
# 估计量的评选标准
# 无偏性
要求估计量的数学期望等于参数的真值
设θ^=θ^(X1,X2,...,Xn) 是参数θ 的估计量,若对于任意的θ∈Θ,有
E(θ^)=θ
则称θ^ 是θ 的无偏估计量,记
bn=E(θ^)−θ
称bn 为估计量θ^ 的偏差
- 若bn=0,则称θ^ 是θ 的有偏估计量
- 若bn=0,则称θ^ 是θ 的渐进无偏估计量
实例
-
不论总体X 服从什么分布,其样本k 阶原点矩必是对应的总体k 阶原点矩αk 的无偏估计,特别地,样本均值X 是总体均值E(X) 的无偏估计
-
样本方差S2=n−11i=1∑n(Xi−X)2 是总体方差σ2 的无偏估计,但是样本标准差S 不是总体标准差σ 的无偏估计
总体方差σ2 的矩估计S^2=n1i=1∑n(Xi−X)2 是有偏估计
-
若(X1,X2,...,Xn) 是总体X 的一个样本,则对于任意满足i=1∑nci=1 的常数ci 而言,估计量i=1∑nciXi 总是总体期望E(X) 的无偏估计量
-
若θ^ 是θ 的无偏估计,对于θ 的函数g(θ),g(θ^) 不一定是g(θ) 的无偏估计
# 有效性
设θ^1=θ^1(X1,X2,...,Xn) 与θ^2=θ^2(X1,X2,...,Xn) 都是待估参数θ 的无偏估计,若有
D(θ^1)<D(θ^2)
则称θ^1 较θ^2 有效
设θ^0(X1,X2,...,Xn) 是参数θ 的无偏估计量,若对θ 的任一无偏估计量θ^(X1,X2,...,Xn),都有
D(θ^0)<D(θ^)
则称θ^0 是θ 的最小方差无偏估计量
# 一致性
设θ^(X1,X2,...,Xn) 为参数θ 的估计量,若对任意的θ∈Θ 及任意的ε>0,有
n→∞limP(∣θ^(X1,X2,...,Xn)−θ∣≤ε)=1
则称θ^(X1,X2,...,Xn) 为θ 的一致估计量
总体原点矩的连续函数u=g(α1,α2,...,αk) 的矩估计u^=g(A1,A2,...,Ak)(其中Ak=n1i=1∑nXik)是一致估计量;在一定条件下,待估参数的极大似然估计量也具有一致性。
# 区间估计
# 区间估计的概念
设总体X 的分布函数为F(x,θ),其中θ 是未知参数,(X1,X2,...,Xn) 为X 的样本,给定α(0<α<1),若统计量θ=θ(X1,X2,...,Xn) 和θ=θ(X1,X2,...,Xn) 满足
P(θ<θ<θ)=1−α
则称区间(θ,θ) 是参数θ 的置信水平为1−α 的置信区间
# 单个正态总体均值的区间估计
# σ2 已知情形
μ 的置信水平为1−α 的置信区间为
(X−nσuα/2,X+nσuα/2)
误差 / 置信区间长度为:
n2σuα/2
- 对于给定α,区间长度l 随 n 的增大而减小
- 对于给定的 n,区间长度l 随α 的减小而增大
# σ2 未知情形
μ 的置信水平为1−α 的置信区间为
(X−nStα/2(n−1),X+nSuα/2(n−1))
求得的置信区间长度最短
# 单个正态总体方差的区间估计
# μ 未知的情况
σ2 的置信水平为1−α 的置信区间为
(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
标准差σ 的置信水平为1−α 的置信区间为
(χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2)
对于概率密度曲线不对称的情况,如χ2 分布和F 分布,习惯上扔取对称的分位点,但是置信区间长度不是最短的
# 两个正态总体均值差的区间估计
# σ12 和σ22 均为已知
μ1−μ2 的置信水平为1−α 的置信区间为
(X−Y−n1σ12+n2σ22uα/2,X−Y+n1σ12+n2σ22uα/2)
# σ12 和σ22 均为未知,但σ12=σ22=σ2
μ1−μ2 的置信水平为1−α 的置信区间为
(X−Y−tα/2(n1+n2−2)Swn11+n21,X−Y+tα/2(n1+n2−2)Swn11+n21)
其中S_w=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}
# 两个正态总体方差比的区间估计
# μ1 和μ2 均未知的情况
σ22σ12 的置信水平为1−α 的置信区间为
(S22S12Fα/2(n1−1,n2−1)1,S22S12F1−α/2(n1−1,n2−1)1)
# 单侧置信区间
设总体X 的分布函数为F(x,θ),其中θ 是未知参数,(X1,X2,...,Xn) 为X 的样本,给定α(0<α<1),若统计量θ=θ(X1,X2,...,Xn)
P(θ>θ)=1−α
则称区间(θ,+∞) 是参数θ 的置信水平为1−α 的单侧置信区间
将α/2 改成α 即可