概要#

ノンパラメトリック法#

ノンパラメトリック法ではモデルの想定を弱めて構造の連続性や滑らかさのみを仮定することが多い。

ノンパラではモデル想定の間違いによって生じる推定の誤りは少なくなり頑健になるものの、一般に推定精度が低くなる。

nをサンプルサイズとして、一般にパラメトリック推定量はn1/2のオーダーで収束するが、ノンパラメトリック推定量はn1/2+δ(δ>0)のオーダーとなる。

セミパラメトリックモデル#

セミパラメトリックモデルは有限次元のパラメータとノンパラメトリックな関数の両方を未知パラメータとして含むモデル

有限次元パラメータについてはパラメトリック推定量と同じ収束のオーダーになる。

モデルを部分的にパラメトリックにできるため、関心のあるパラメータが有限次元である状況とは相性がいいアプローチ

パラメトリックモデルの特定化を誤るとどうなるか#

仮定したパラメトリックモデルが誤っているとき、それに基づく推定量は本来意図した量とは異なる量を推定してしまう。

例:最尤推定法#

ある密度関数f0(x)から無作為標本(X1,,Xn)が得られたとする。未知パラメータベクトルθを持つパラメトリックモデルf(x;θ),θΘを想定したとき、最尤推定量は

θ^:=argmaxθi=1nlogf(Xi;θ)

と定義される(Θはパラメータがとりうる値の集合で、パラメータ空間という)。

「モデルが正しい」とは

θ0Θ s.t. f0(x)=f(x;θ0)

すなわち、尤度関数の設計に際して仮定した密度関数f(x;θ0)が真の密度関数f0(x)に一致する、ということ。このとき一定の正則条件が満たされればθ^は一致性、漸近正規性、効率性をもつ。つまり

θ^pθ0n(θ^θ)dN(0,I(θ0)1)

が成り立つ。ただしI(θ)は情報行列

I(θ)=2logf(x;θ)θθTf(x;θ0)dx

である。情報行列の逆行列が一定の正則条件のもとでの漸近正規性・一致性を持つ推定量の漸近分散の下限となる。(これは不偏推定量の場合の Cramer-Raoの下限に対応する)

モデルが誤っている場合の最尤推定量#

もし、仮定したパラメトリックモデルが間違っている、すなわち、どのθΘに対してもf(x;θ)f0(x)なら、最尤推定量はカルバック・ライブラー距離を最小にする値

θ1=argminlogf0(x)f(x;θ)f0(x)dx

に収束する(つまりθ^pθ1)。これを擬似真値という。

真の分布が左右対称の単峰の分布ならある程度は真の分布に近い密度推定が得られる。しかし真の分布が二峰の場合は視覚的にも全く異なる推定結果となる。