符号定义
-
数据矩阵定义:
X=(x1x2⋯xP)N×P⊤
-
约束条件:
- xi∈RP
- xi∼i.i.d.N(μ,Σ)
-
参数定义:
θ=(μ,Σ)
-
最大似然估计:
MLE=θargmaxP(X∣θ)
极大似然估计推导(一维)
令 P=1 , θ=(μ,σ2) , p(x)=2πσ21exp(−2σ2(x−μ)2) 。由于 xi∼i.i.d.N(μ,Σ) , 有 logP(X∣θ)=logi=1∏Np(xi) ,可做如下推导:
logP(X∣θ)=logi=1∏Np(xi∣θ)=i=1∑Nlogp(xi∣θ)=i=1∑Nlog2πσ1exp(−2σ2(xi−μ)2)=i=1∑N[log2π1−logσ−2μ2(x−μ)2](1)
μMLE 推导
由(1)可得 μMLE=μargmaxP(X∣θ)=μargmini=1∑N(xi−μ)2 。此处我们令 ∂μ∂i=1∑N(xi−μ)2=0 ,可做如下推导:
∂μ∂i=1∑N(xi−μ)2i=1∑N−2(xi−μ)⇒μMLE=i=1∑N−2(xi−μ)=0=0=N1i=1∑Nxi(2)
此处 μMLE 是无偏的
σMLE2 推导
同理由(1)可得:
σMLE2∂σ∂L=σargmaxP(X∣θ)=σargmaxi=1∑NL−logσ−2σ(xi−μMLE)2=−σ1+21(xi−μMLE)2(2σ−3)⇒σMLE2=N1i=1∑N(xi−μMLE)2(3)
此处 σMLE 是有偏的
无偏估计相关
定义
若 E[T(x)]=T(x) ,则无偏,否则有偏。
μMLE 无偏证明
E[μMLE]=E[N1i=1∑Nxi]=N1i=1∑NE[xi]=N1i=1∑NE[μ](因为xi∼i.i.d.N(μ,Σ))=μ
σMLE2 有偏证明与无偏估计量
化简:
σMLE2=N1i=1∑N(xi−μMLE)2=N1i=1∑N(xi2−2xiμMLE+μMLE2)=N1i=1∑Nxi2−2μMLE2N1i=1∑N2xiμMLE−μMLE2N1i=1∑NμMLE2=N1i=1∑Nxi2−μMLE2
N1i=1∑N2xiμMLE 化简过程
N1i=1∑N2xiμMLE=2μMLE×N1i=1∑Nxi=2μMLE2(μMLE在此处为常数)
带入可得:
E[σMLE2]=E[N1i=1∑Nxi2−μMLE2]=E[N1i=1∑N(xi2−μ2−(μMLE2−μ2))]=①E[N1i=1∑N(xi2−μ2)]−②E[N1i=1∑N(μMLE2−μ2)]
对于其中的①:
E[N1i=1∑N(xi2−μ2)]=N1i=1∑NE[(xi2−μ2)]=N1i=1∑N(E[xi2]−μ2)=Var(X)=σ2
对于其中的②:
E[N1i=1∑N(μMLE2−μ2)]=E[μMLE2]−E[μMLE]2=Var(μMLE)=Var(N1i=1∑Nxi)=N21i=1∑NVar(xi)=N21i=1∑Nσ2=N1σ2
关于 E[N1i=1∑N(μMLE2−μ2)]=E[μMLE2]−E[μMLE]2
首先我们可以得到 E[N1i=1∑N(μMLE2−μ2)]=E[μMLE2−μ2]=E[μMLE2]−μ2 ,又由于 E[μMLE] 无偏,即 E[μMLE]=μ ,将其反代回原式即可得
E[N1i=1∑N(μMLE2−μ2)]=E[μMLE2]−μ2=E[μMLE2]−E[μMLE]2
将①、②代回式中,我们可以得到 E[σMLE2]=NN−1σ2 ,即 E[σMLE2] 为有偏估计。
小结
本节中我们进行了一维高斯分布参数的极大似然度估计与无偏证明,在下一节中,我们将进行多维高斯分布的推导以及提出它的局限性。