最尤推定法に基づく正規方程式の導出

最尤推定法に基づく正規方程式の導出#

被説明変数yを、説明変数Xと回帰係数βの線形結合と誤差項εによって表現する線形回帰モデル

y=Xβ+ε

を考える。また、以下を仮定する(古典的正規回帰モデル(Classical Normal Regression Model: CNRM) の仮定)

  1. 説明変数Xは非確率的である

  2. E[Y]=Xβであり、したがって誤差項の期待値はゼロ:E(ε)=0

  3. 誤差項の分散σ2は一定(均一分散)であり、共分散はゼロ(独立性):Var(ε)=σ2I

  4. Xの階数はkrank(X)=kXXに逆行列が存在することの仮定)

  5. Yは正規分布に従う(正規性):YN(Xβ,σ2I),εN(0,σ2I)

特に3(標本がi.i.d.)と5(正規性)は最尤推定のために必要で、誤差項εi=yixiβが従う分布型を仮定することで最尤推定が可能になる。

尤度としては、平均xiβの正規分布で観測値yiが得られる確率N(yi|xiβ,σ2I)を用いて

L(y|X,β,σ)=i=1NN(yi|xiβ,σ2I)

ただし、Nは正規分布

N(x|μ,σ2)=12πσexp{(xμ)22σ2},<x<

対数尤度は

lnL(y|X,β,σ)=i=1NlnN(yi|xiβ,σ2)=N2ln(2π)N2lnσ212σ2i=1N(yixiβ)2

回帰係数の推定#

対数尤度をβについて微分した勾配を0と置いて解くと

lnL(y|X,β,σ)=1σ2i=1N(yixiβ)xi=1σ2(i=1Nyixi)β1σ2(i=1Nxixi)=1σ2(Xy)β1σ2XX=0β^=(XX)1Xy

となり、最尤推定量と最小二乗推定量が同じ方程式になることがわかる

標準偏差σの導出#

lnL(y|X,β,σ)σ=σ(N2ln(2π)N2lnσ212σ2i=1N(yixiβ)2)=N21σ22σ+4σ4σ4i=1N(yixiβ)2=Nσ+1σ3i=1N(yixiβ)2

これをゼロにするσ2

Nσ+1σ3i=1N(yixiβ)2=0Nσ=1σ3i=1N(yixiβ)2σ3σ=σ3Nσ3i=1N(yixiβ)2σ2=1Ni=1N(yixiβ)2

となる

βの最尤推定量 β^ML=(XX)1Xyを代入すると

σ^ML2=1Ni=1N(yixiβ^ML)2=εεN