充分统计量
Definition:
称统计量U=ϕ(X1,X2,…,Xn)是$ \theta 的==完全统计量==,若任给函数u$,如果
Eθ(u(ϕ(X1,X2,…,Xn)))=0
可以推出
Pθ(u(ϕ(X1,X2,…,Xn))=0)=1
- 在两点分布中 ϕ(X1,X2,…,Xn)=∑1nXi为完全统计量,
但ϕ1(X1,X2,…,Xn)=(∑1kXi,∑k+1nXi)不是完全统计量
- 该保留的信息都保留——充分性
- 该丢掉的信息都丢掉——完全性
- 可以证明,若参数空间θ有内点,则指数分布族中的充分统计量
(1∑nT1(xi),1∑nT2(xi),⋯,1∑nTn(xi))
也是完全的
定理 : (Blackwell-Lehmann-Scheffe)若ϕ(X1,X2,…,Xn)为θ完全充分统计量且ψ(ϕ(X1,X2,…,Xn))为g(θ)的无偏估计,则一定为g(θ)一致最小方差无偏估计,且在概率为1的意义下唯一
对于正态分布,(Xˉ,∑(Xi−Xˉ)2)为完全的充分统计量,由E(Xˉ)=μ,令S=n−1∑(Xi−Xˉ)2 则其为σ2的无偏估计,也是一致最小方差无偏估计
- 无偏估计有可能不存在,因为多项式函数不可以表示无理函数(或者有理函数)
- 无偏估计有时就算存在也不合理:X服从参数为θ的泊松分布,样本量为1,g(θ)=e−2θ则其唯一无偏估计为(−1)X
- 在统计中,无偏性是自然的合理的要求
定理(Cramer-Rao不等式):设X的密度函数为f(x;θ),θ∈(a,b),(X1,X2⋯,Xn)为简单随机样本,ϕ(X1,X2,…,Xn)为g(θ)的无偏估计,则在下列条件下,
- X的支撑E:=x:f(x;θ)>0与θ无关
- g(θ) 与 θ∂f(x;θ)c存在,且积分与求导可交换
我们有不等式
varθ(ϕ(X1,X2,…,Xn))≥nl(θ)g′(θ)
其中
l(θ)=:Eθ(∂θ∂logf(x;θ))2>0
为==Fisher信息量==
例1:两点分布 X~B(1,p)
f(x,p)=px(1−p)1−x
l(θ)=:Eθ(∂θ∂logf(x;θ))2=Eθ(pX−1−p1−X)=p(1−p)1
例2:正态分布X~N(μ,σ02)
则
∂θ∂logf(x;θ)=σ02x−μ
l(μ)=
以上例子都达到了C-R不等式的下界
- 有时最小方差无偏估计即使存在也达不到C-R不等式的下界
例4: X~U(0,θ)
令θ^=nn+1maxXi,θ^为θ的无偏估计,容易验证,Var(θ^)=n(n+2)θ2,比C-R不等式更快的趋向于0,但同时其不满足条件(1)
- 自行查找l(θ)
- 参数维数为m时,也有相应不等式,不等号右边为二次型
n1g′(θ)Tl(θ)−1g′(θ)
- 大样本性质:当样本量n趋于无穷时的性质,如(强)相合性,还有收敛速度等。常有
n(θ^n−θ)→N(0,∑(θ))
以及渐进协差阵∑(θ)与l(θ)的关系
- 小样本性质:无偏性、最小方差,C-R不等式等
- 相合估计是否一定无偏?无偏估计是否一定相合?