経験過程#
Notation#
\(P\):可測空間\((\mathcal{X}, \mathcal{B})\)における測度
\(f: \mathcal{X} \mapsto \mathbb{R}^k\):可測関数
\(Pf = \int f dP\)
\(E_P f(X_1)\):期待値。\(X_1\)は\(P\)に従い分布する確率変数
経験過程#
標本\(X_1,\dots,X_n\)の 経験測度(empirical measure) \(\mathbb{P}_n\)は
経験過程(empirical process) \(\mathbb{G}_n\)は経験測度の中心化されスケールされたものであり、
と定義される。
経験分布関数#
分布関数\(F\)から得られた確率標本\(X_1,\dots,X_n\)があるとする。
経験分布関数 (empirical distribution function)は以下のように定義される。
\(n\mathbb{F}_n(t)\)は平均\(nF(t)\)で二項分布するため、この推定量は不偏である。 また、大数の法則により一致性もある。
中心極限定理により、漸近正規性をもつ。
Glivenko-Cantelli theorem#
大数の法則を拡張し、一様収束(uniform convergence)することを示す。
まず、uniform distanceについて。経験分布のuniform distance
はKolmogorov-Smirnov統計量として知られている。
定理(Glivenko-Cantelli)
\(X_1,X_2,\dots,\)が分布関数\(F\)に従うi.i.d.の確率変数であるとき、
Donsker定理#
i.i.d. でない系列にも適用できるよう一般化した中心極限定理。
定理(Donsker)
\(X_1,X_2,\dots,\)が分布関数\(F\)に従うi.i.d.の確率変数であるとき、
経験過程の列\(\sqrt{n}\left(\mathbb{F}_n-F\right)\)は空間\(D[-\infty, \infty]\)におけるタイトな確率要素(random element) \(\mathbb{G}_F\)に分布収束し、その周辺分布は平均が0で共分散関数が\(\mathrm{EG}_F\left(t_i\right) \mathbb{G}_F\left(t_j\right)=F\left(t_i \wedge t_j\right)-F\left(t_i\right) F\left(t_j\right)\)である正規分布になる
\(\mathbb{G}_F\)は\(F\)-ブラウン橋(F-Brownian bridge)過程として知られる