標本分布#

統計量の確率分布#

統計的性質を分析したい対象を母集団(population)といい、調査等により母集団から得られたデータを標本(sample)という。

統計的推測では母集団の平均(母平均μや分散(母分散σ2といった母数(population parameter)を標本に基づいて推定する。

標本から得られた平均や分散

X¯=1ni=1nXiS2=1ni=1n(XiX¯)2

はそれぞれ標本平均(sample mean)や標本分散(sample variance)と呼ばれる。

標本平均のような、標本に基づいた関数で母数を含んでないものを統計量(statistics)といい、その確率分布を標本分布(sampling distribution)という。

母数の推定のためには統計量がどのようにばらつくか等の標本分布の性質が利用される。

平均がμ、分散がσ2の確率分布を母集団とする独立同分布から得られたランダム・サンプルを

X1,,Xn,i.i.d.(μ,σ2)

と書くことにする。

E[Xi]=μ,V[Xi]=σ2を用いて、標本平均X¯の平均と分散を計算すると

E[X¯]=1ni=1nE[Xi]=1ni=1nμ=μV[X¯]=1n2i=1nV[Xi]=σ2n

となる。

線形結合の平均・分散

定数a1,,akによる線形結合i=1kaiXiを考えると、平均は

E[i=1kaiXi]=i=1kaiE[Xi]=i=1kaiμi

分散は

V[i=1kaiXi]=E[{i=1kai(Xiμi)}2]=E[i=1k{ai(Xiμi)}2+i=1kj=i+1kaiaj(Xiμi)(Xjμj)]=i=1kai2E[(Xiμi)2]+2i=1kj=i+1kaiajE[(Xiμi)(Xjμj)]=i=1kai2σii+2i=1kj=i+1kaiajσij

であり、X1,,Xnが互いに独立であれば共分散σijはゼロになるため

V[i=1kaiXi]=i=1kai2σii

となる。

これらの線形結合の定数ai1/nに置き換えれば上記の標本分布の平均や分散の式になる。

(参考)和の二乗の展開
(x1+x2+x3)2=x12+x22+x32+2(x1x2+x1x3+x2x3)=i=1nxi2+2i=1nj=i+1nxixj

なので

(x1++xn)2=(i=1nxi)2=i=1nxi2+2i=1nj=i+1nxixj

不偏分散#

なお、X¯は期待値をとるとμになるが、S2の期待値はσ2にはならない。

XiX¯=Xiμ(X¯μ)と代入すると、

i=1n(XiX¯)2=i=1n[(Xiμ)(X¯μ)]2=i=1n(Xiμ)22i=1n(Xiμ)(X¯μ)+i=1n(X¯μ)2=i=1n(Xiμ)22(X¯μ)i=1n(Xiμ)+n(X¯μ)2(X¯μ)=i=1n(Xiμ)22(X¯μ)(nX¯nμ)+n(X¯μ)2(X¯=1nXinX¯=Xi)=i=1n(Xiμ)22n(X¯μ)2+n(X¯μ)2=i=1n(Xiμ)2n(X¯μ)2

なので

E[i=1n(XiX¯)2]=i=1nE[(Xiμ)2]nE[(X¯μ)2]=nσ2nσ2n=(n1)σ2

となるため、期待値がσ2になるためにはi=1n(XiX¯)2n1で割る必要がある。そのような統計量

V2=1n1i=1n(XiX¯)2

を不偏分散という。

標本分散と不偏分散の変換を行う補正

V2=aS2

とおけば、

a=nn1

逆のことをやりたい場合はn1nを乗じる (例えば、Rのvar()はn-1固定なので標本分散にしたい場合はこっちを掛ける)

n1nV2=n1n1n1i=1n(XiX¯)2=1ni=1n(XiX¯)2=S2

不偏標準偏差

非線形変換をかませるので、どの分布でも一般に不偏標準偏差になるとは言えない

不偏分散の平方根は標準偏差の不偏推定量か | ブログ | 統計WEB

最尤推定量はnで割る#

最尤推定量は不偏分散とは一致しない。

データx=(x1,x2,,xn)が正規分布

P(x|μ,σ2)=12πσexp{(xμ)22σ2}

に従う独立に得られたサンプルだとする。

対数尤度関数は次のものになる。

(μ,σ2|x)=n2log(2π)n2log(σ2)12σ2i=1n(xiμ)2

まずμに関して偏微分してゼロとおくと

μ(μ,σ2|x)=1×2×12σ2i=1n(xiμ)=1σ2i=1n(xiμ)=1σ2i=1nxi1σ2i=1nμ=01σ2i=1nxi=1σ2i=1nμ1σ2i=1nxi=nσ2μ1ni=1nxi=μ

よって

μ^=1ni=1nxi=x¯

なので、最尤推定量とモーメント推定量は一致する。

続いてσ2について偏微分してゼロとおくと

σ2(μ,σ2|x)=n2σ2+12σ4i=1n(xiμ)2=0n2σ2=12σ4i=1n(xiμ)2n=1σ2i=1n(xiμ)2σ2=1ni=1n(xiμ)2

よって

σ^2=1ni=1n(xix¯)2

となり、こちらもモーメント推定量と一致する

参考文献#