一般化モーメント法#

モーメント法#

モーメント法 (method of moment)は統計的推定における方法の1つで、母集団におけるモーメント(母平均など)を標本におけるモーメント(標本平均など)で置き換えて推定を行う。

確率変数Xの分布がk次元の未知のパラメータθ=(θ1,,θk)をもつとする。このとき、

E[m(X,θ)]=E[m1(X,θ)mk(X,θ)]=0

を満たすようにk個の関数(スコア関数)m1(,),,mk(,)をうまく選べたとする。

モーメント法ではこの条件を解いてθを求めることでパラメータを推定する。

標本X1,,Xnが得られたとき、θjのモーメント推定量θ^

1ni=1nmk(Xi;θ^)=0

により定義される。

大数の法則により、i.i.d.のサンプルの標本モーメントは母集団モーメントに確率収束する、すなわち

1ni=1nmk(Xi;θ^)pE[mk(X,θ)]

であるため、標本モーメントを用いて推定ができる。

例:正規分布の平均と分散

正規分布N(μ,σ2)から無作為抽出された標本の平均と分散を求めたいとする。

原点のまわりの1次と2次のモーメントは

E[X]=μE[X2]=σ2+μ2

であるため、モーメント条件を

E[m1(Xi;μ,σ2)]=E[Xiμ]=0E[m2(Xi;μ,σ2)]=E[Xi2(σ2+μ2)]=0

とおいて標本X1,X2,,Xnで推定することで平均と分散の推定量を得られる。

標本対応したモーメント条件

1ni=1n(Xiμ^)=01ni=1n[Xi2(σ^2+μ^2)]=0

を解くと

1ni=1n(Xiμ^)=01ni=1nμ^=1ni=1nXiμ^=1ni=1nXi1ni=1n[Xi2(σ^2+μ^2)]=01ni=1nXi2=1ni=1nσ^2+1ni=1nμ^2σ^2=1ni=1nXi2μ^2

となり、標本平均・標本分散と一致する

例:線形回帰モデル

線形回帰モデル

Yi=XiTβ+ui

のパラメータβの推定を考える。ここでXβ(k×1)ベクトルとする。Xは誤差項と無相関E[Xiui]=0であるとする。

このモデルからk本のモーメント条件が得られる

E[Xiui]=E[Xi(YiXiTβ)]=0

標本対応は

1ni=1nXiui=1ni=1nXi(YiXiTβ)

行列表記では

1nXTu=1nXT(YXβ)=0

となる。これを解くと

1nXTY=1nXTXββ=(XTX)1XTY

と、最小二乗法の解と一致する ::

一般化モーメント法(GMM)#

未知のパラメータの数kとモーメント条件の数rが等しい(k=r)場合、上記のようにモーメント法で推定が可能である。

しかし、k>rk<rの場合はモーメント法ではパラメータをうまく推定できない。

一般化モーメント法(generalized method of moment: GMM)k<r、すなわちモーメント条件のほうが多い場合でも推定できるようにした方法である。

モーメント条件のほうが多い場合、r本の条件式

E[m(X,θ)]=E[m1(X,θ)mr(X,θ)]

が全体的に0に近くなるように

minθQn(θ)=[1Ni=1Nm(Xi;θ)]TW[1Ni=1Nm(Xi;θ)]

となるようにθを選ぶ。ここでWはウェイト行列(weight matrix)と呼ばれる。単にW=Iとすることもできるが、うまくウェイトを用いることで推定精度を向上させることができる。

この方法は 最小距離推定 (minimum distance estimation)と呼ばれる広いクラスの推定法の中の特別な場合だと解釈できるが、計量経済学ではこの方法を最初に導入したHansen (1982) に倣って 一般化モーメント法 (generalized method of moment: GMM)と呼ぶ。

この最小化問題は

[1Ni=1Nm(Xi;θ~)θT]TW[1Ni=1Nm(Xi;θ~)]=0

を解いて求める。

ただし、

m(Xi;θ~)θ=m(Xi;θ)θ|θ=θ~

である。

一般化モーメント法と操作変数法#

Y=Xβ+u,Var[u]=σ2In

において、Xuは無相関ではなくE[XTu]0であるが、操作変数のn×l行列Zに対してE[ZTu]=0であるとする。

E[Ziui]=E[Zi(YiXiTβ)]=0

を直交条件にすると、標本対応は

1nZT(YXβ)

となる。したがってβのGMM推定量は

β^GMM=arg minβ[ZT(YXβ)n]TWn[ZT(YXβ)n]

である。

ここで

E[u]=0E[uuT]=σ2IplimnZTZn=MZZ

および特定の条件下で

ZT(YXβ)nDN(0,σ2Mzz)

であるので

Wnp(σ2MZZ)1

となるWnをウェイト行列として用いるのが望ましい。

Wn=(σ2ZTZn)1

を用いると

β^GMM=arg minβ[ZT(YXβ)n]T(σ2ZTZn)1[ZT(YXβ)n]

であるので、この目的関数をβで微分してゼロとおいて解くか、公式

[1Ni=1Nm(Xi;θ~)θT]TW[1Ni=1Nm(Xi;θ~)]=0

にあてはめ(左側のスコア関数だけ微分)した

[ZTXn]T(σ2ZTZn)1[ZT(YXβ^)n]=0

を解くことによって推定量が得られる。

β^GMM=(XTZ(ZTZ)1ZTX)1XTZ(ZTZ)1ZTy

となり、操作変数推定量(2段階最小二乗法推定量)に一致する。

操作変数の数lと説明変数の数kが等しい場合はZTXが正方行列となり(ZTX)1が存在するため

β^GMM=(ZTX)1ZTy

と単純化できる

展開

(AB)1=B1A1を使った

β^GMM=(XTZ(ZTZ)1ZTX)1XTZ(ZTZ)1ZTy=(ZTX)1(XTZ(ZTZ)1)1XTZ(ZTZ)1ZTy=(ZTX)1(ZTZ)(XTZ)1XTZ(ZTZ)1ZTy=(ZTX)1ZTy

一般化モーメント法と最尤推定法#

最尤推定量は対数尤度の導関数をスコア関数とした

E[logf(Y|X;θ)θ]=0

という直交条件の下でのGMM推定量と考えることができる。

確率密度によるモーメント条件#

Yiの条件付き確率密度関数をf(Yi|Xi;θ)とする。確率密度関数の性質から、積分すると1になるので

f(Yi|Xi;θ)dyi=1

となる。両辺をθについて微分すると

f(Yi|Xi;θ)θdyi=0

となる。

f(Yi|Xi;θ)θ=f(Yi|Xi;θ)θ1f(Yi|Xi;θ)f(Yi|Xi;θ)=logf(Yi|Xi;θ)θf(Yi|Xi;θ)

という関係を用いて

logf(Yi|Xi;θ)θf(Yi|Xi;θ)dyi=0

とすることができる。

スコア関数を

m(Xi,θ)=logf(Yi|Xi;θ)θ

とおけば、

m(Xi,θ)f(Yi|Xi;θ)dyi=0

となり、これは条件付き確率f(Yi|Xi;θ)による条件付き期待値

E[m(Xi,θ)Xi]=0

となっている。繰り返し期待値の法則により

E[m(Xi,θ)]=0

であるから、この式を直交条件として用いることができる。

モーメント推定量と最尤推定量#

モーメント法では標本モーメント条件

1ni=1nlogf(Yi|Xi;θ)θ=0

を解く。

最尤推定法では対数尤度関数の最大化において

i=1nlogf(Yi|Xi;θ)θ=0

を解くため、GMM推定量と最尤推定量は一致する。

例:線形回帰モデル

線形回帰モデル

y=Xβ+u,(E[u]=0,V[u]=σ2In)

を考える(簡単のためσ2は既知とする)

誤差が正規分布に従うと仮定して尤度関数を特定化する場合、

L(β;y)=i=1nf(yiXi;β)=i=1n12πσexp[(yiXiTβ)22σ2]

対数尤度の導関数をスコア関数とすると

m(yi,Xi;β)=logf(yiXi;β)β=(yiXiTβ)Xiσ2

なので、この直交条件はE[uiXi]=0を意味する。

(※前述のように、この直交条件はuiが正規分布に従うと仮定しなくても使えるしβの一致推定量を得られる)

このスコア関数の標本対応は

1ni=1n(yiXiTβ)Xiσ2=1nσ2XT(yXβ)=0

であり、これを解くとβ=(XTX)1XTYとなる

参考文献#