経験過程#

Notation#

  • P:可測空間(X,B)における測度

  • f:XRk:可測関数

  • Pf=fdP

  • EPf(X1):期待値。X1Pに従い分布する確率変数

経験過程#

標本X1,,Xn経験測度(empirical measure) Pn

Pnf=1ni=1nf(Xi)

経験過程(empirical process) Gnは経験測度の中心化されスケールされたものであり、

Gnf:=n(PnfPf)=1ni=1n(f(Xi)EPf(Xi))

と定義される。

経験分布関数#

分布関数Fから得られた確率標本X1,,Xnがあるとする。

経験分布関数 (empirical distribution function)は以下のように定義される。

Fn(t)=1ni=1n1{Xit}

nFn(t)は平均nF(t)で二項分布するため、この推定量は不偏である。 また、大数の法則により一致性もある。

Fn(t) as F(t), every t

中心極限定理により、漸近正規性をもつ。

n(Fn(t)F(t))N(0,F(t)(1F(t)))

Glivenko-Cantelli theorem#

大数の法則を拡張し、一様収束(uniform convergence)することを示す。

まず、uniform distanceについて。経験分布のuniform distance

FnF=supt|Fn(t)F(t)|

はKolmogorov-Smirnov統計量として知られている。

定理(Glivenko-Cantelli)

X1,X2,,が分布関数Fに従うi.i.d.の確率変数であるとき、

FnFas0

Donsker定理#

i.i.d. でない系列にも適用できるよう一般化した中心極限定理。

定理(Donsker)

X1,X2,,が分布関数Fに従うi.i.d.の確率変数であるとき、

経験過程の列n(FnF)は空間D[,]におけるタイトな確率要素(random element) GFに分布収束し、その周辺分布は平均が0で共分散関数がEGF(ti)GF(tj)=F(titj)F(ti)F(tj)である正規分布になる

GFF-ブラウン橋(F-Brownian bridge)過程として知られる

超一般化中心極限定理

Donsker定理をさらに一般化したものも提案されている様子

なぜ世界は「べき則」であらわされるのか -ビッグデータの新しい統計法則の発見- | 京都大学

参考文献#