参数估计
概念
已知总体分布类型, 与容量为 n 的样本的值 x1,x2,...,xn, 但参数未知 θi, 通过特定估计量(统计量), 估计未知参数
矩估计法 P100
单个参数
- 使用 X=n1∑i=1nXi 估计总体均值 EX
- 寻找参数与总体期望的关系 EX=g(θi)
- 解方程(xi 为已知量/常数)
n1i=1∑nxi=g(θi^)
双参数
- 使用 X=n1∑i=1nXi2 估计总体均值 E(X2)
- 寻找参数与总体期望以及平方期望的关系
EXE(X2)=g(θ1,θ2)=f(θ1,θ2)
- 解方程
- 可使用
S∗2=n1i=1∑n(Xi−X)2
估计 DX, 代替 E(X2) , 注意不是 S2, 此处分母为 n
不变性
未知参数 θ 有矩估计 θ^(x1,x2,...,xn) , 对于未知参数 θ′=g(θ), g(θ) 单值单调(有单值反函数)(概率分布函数符合这一性质), 则 θ′ 的矩估计 θ′^=g(θ^)
极大似然估计 P103
概念
- 假设实验结果出现的概率极大, 因此分布的参数应使实验结果出现的概率达到最大值, 以符合这一要求
- 各个样本之间独立同分布
- 求 θ 使 L 取得最大值
L(θ)=P(X1=x1,X2=x2,...,Xn=xn)=P(X1=x1)P(X2=x2)...P(Xn=xn)
连续型
- 使用概率密度观察该点的函数值
- 此时 θ 为密度函数内的一个未知参数, 将这个参数作为变量, 随机变量的取值为已知量(常量)
L(θ)=f(x1;θ)f(x2;θ)...f(xn;θ)
- 求使 L(θ) 达到最大值的 θ^ , 等价于使 ln[L(θ)] 达到最大值, 可用于简化求值
ln[L(θ)]=ln[f(x1;θ)]+ln[f(x2;θ)]+...+ln[f(xn;θ)]
- 对 θ 求导, xi 为常量, 求出最大值点, 得到 θ^
- 多个未知参数则求偏导
- 导数不为零时, 结合 xi 对未知参数的限制, 分析得出未知参数 P105
离散型
L(θ)=P(X1=x1;θ)P(X2=x2;θ)...P(Xn=xn;θ)
- 同连续型, 取对数求导
性质
- 不变性 未知参数 θ 有极大似然估计 θ^(x1,x2,...,xn) , 对于未知参数 θ′=g(θ), g(θ) 单值单调(有单值反函数)(概率分布函数符合这一性质), 则 θ′ 的极大似然估计 θ′^=g(θ^)
- 正态分布总体的极大似然估计
μ=X=n1i=1∑nXi
σ2=n1i=1∑n(Xi−μ)2
估计量的选择标准
使用估计量 Z=f(X1,X2,...,Xn) 估计参数 θ
无偏性
- 当 EZ=θ 称 Z 为参数 θ 的无偏估计
- 当 limn→∞(EZ−θ)=0 称 Z 为参数 θ 的渐近无偏估计
- 否则称 Z 为参数 θ 的有偏估计
有效性
使用无偏估计量 Z1=f(X1,X2,...,Xn) 与 Z2=f(X1,X2,...,Xn) 估计参数 θ 当 DZ1<DZ2 则称 Z1 比 Z2 有效
一致性
当估计量序列(Zn=f(X1,X2,...,Xn)) 依概率收敛于 θ, 则称 Z 为参数 θ 的一致估计量 对于任意 ε>0
n→∞limP(∣Zn−θ∣>ε)=0
区间估计
对于参数 θ
P(u≤θ≤u)=1−α
- u 置信下限
- u 置信上限
- α 置信水平
- [u,u] 置信区间 对于一个置信水平可能有多个置信区间, (正态分布)一般取关于关于均值对称的区间
- L=u−u 置信长度
正态总体, 已知 σ2 求 μ
根据
σ/nXˉ−μ∼N(0,1)
- 设未知变量 a
P(∣σ/nXˉ−μ∣<a)=1−α
P(Xˉ−nσa<μ<Xˉ+nσa)=1−α
- 求未知变量 a 求对立事件
P(σ/nXˉ−μ<−a)+P(σ/nXˉ−μ>a)=α
根据标准正态密度函数的对称性
P(σ/nXˉ−μ<−a)=P(σ/nXˉ−μ>a)=2α
可得
a=N2α
即标准正态分布上侧的 2α 分位点 3. 结果 置信区间
[Xˉ−nσN2α,Xˉ+nσN2α]
置信长度
L=2nσN2α
正态总体, 求 μ
根据 正态总体的抽样分布
S/nXˉ−μ∼t(n−1)
- σ2 使用统计量 S 估计(注意 S 中的分母与 t 分布的 n−1)
- t 分布密度函数具有对称性, 可得 a=t2α(n−1)
- 同已知 σ2 的方式处理 得到结果 置信区间
[Xˉ−nSt2α(n−1),Xˉ+nSt2α(n−1)]
置信长度
L=2nSt2α(n−1)