確率#

標本空間#

確率は世の中で観測される事象に対して定義されるため、まず事象を数学的に記述する。

「六面サイコロを1個投げたときの出目」のような事象(event)の集合

\[ \Omega = \{ 1,2,3,4,5,6 \} \]

標本集合 (sample set) と呼ぶ。また試行の結果得られたものを 標本(sample) と呼ぶ。

事象:σ-加法族#

定義(σ-加法族)

標本空間 \(\Omega\) の部分集合からなる族 \(\mathcal{F}\)\(\Omega \in \mathcal{F}\) を満たすものが

以下の (1), (2) を満たすとき、 \(\mathcal{F}\)有限加法族(集合体) という。

(1) 任意の \(A \in \mathcal{F}\) に対し、 \(A^c:=\Omega \backslash A \in \mathcal{F}\) 。ただし \(\Omega^c=\emptyset\) とする。

(2) \(A_1, A_2 \in \mathcal{F} \Rightarrow A_1 \cup A_2 \in \mathcal{F}\)

有限加法族 \(\mathcal{F}\) がさらに次の (3) を満たすとき、 \(\mathcal{F}\)\(\sigma\)-加法族 (\(\sigma\)-field) や 完全加法族 という。

(3) \(A_i \in \mathcal{F}(i=1,2, \ldots) \implies \displaystyle \bigcup_{i=1}^{\infty} A_i \in \mathcal{F}\)

Note

有限加法族の「有限」とは、有限回の集合演算に対して閉じていることを意味する。

すなわち、任意の\(n\)に対し

\[ A_1,A_2,\dots,A_n \in \mathcal{F} \implies \displaystyle \bigcup_{i=1}^{n} A_i \in \mathcal{F} \]

σ-加法族だと無限回の集合演算に閉じてるということ。

定義(事象)

σ-加法族\(\mathcal{F}\)の元 \(\omega \in \mathcal{F}\)を、事象(event)と呼ぶ。

定義(可測空間)

標本空間 \(\Omega\) とその上の \(\sigma\)-加法族 \(\mathcal{F}\) が与えられたとき、この2つの組 \((\Omega, \mathcal{F})\)可測空間(measurable space) という。

このとき、 事象(\(\mathcal{F}\) の元) を特に 可測集合 (measurable set) ともいう

ただし、なんでもいいわけではなく、例えば\(\mathcal{F}=2^\Omega\)とし、\(\Omega=\mathbb{R}\)と対応付けたような集合は、大きすぎて自然な確率が定義できないことが知られている。

実用的なσ加法族としてボレル集合族というものがある。

ボレル集合族#

標本空間\(\Omega = \mathbb{R}^d ~ (d \in \mathbb{N})\)について、まず\(d=1\)の場合のσ加法族を考える。

区間の集合

\[ \mathcal{I}=\{(a, b] \mid a, b \in \mathbb{R} \cup\{ \pm \infty\}\} \]

を考える。ただし\(b=\infty\)のときは\((a,b]=(a,\infty)\)とし、\(a > b\)のときは\((a,b] = \emptyset\)とする。

これに対し、

\[ \mathcal{A}=\left\{\cup_{k=1}^m I_k \mid m \in \mathbb{N}, I_i \cap I_j=\emptyset(1 \leq i<j \leq m), I_i, I_j \in \mathcal{I}\right\} \]

とすると、これは有限加法族である。このような\(\mathcal{A}\)区間塊 という。

\(\mathcal{A}\)の元に対して、その補集合や積集合を加えて\(\mathcal{A}\)を拡張していくと\(\mathcal{A}\)を含むσ-加法族が出来上がる。

定義

標本空間 \(\Omega\) の部分集合族 \(\mathcal{A}\) に対して, \(\sigma\)-加法族 \(\mathcal{F}\) が以下の 2 条件を満たすとする。

(i) \(\mathcal{A} \subset \mathcal{F}\)

(ii) \(\mathcal{A}\) を含む任意の \(\sigma\)-加法族 \(\mathcal{G}\) に対して, \(\mathcal{F} \subset \mathcal{G}\)

このとき、 \(\mathcal{F}=\sigma(\mathcal{A})\) のように書き、 \(\mathcal{A}\) を含む最小の \(\sigma\)-加法族 という。

上記の区間集合で定義された\(\mathcal{A}\)から作られた\(\sigma(\mathcal{A})\)は、特に\(\mathbb{R}\)上の ボレル集合族 (Borel field) と言われ、

\[ \mathcal{B}:=\sigma(\mathcal{A}) \]

と書かれる。

一般化して\(d\)次元の標本空間\(\Omega = \mathbb{R}^d ~ (d \in \mathbb{N})\)に対しても、\(d\)時点の区間の集合

\[ \mathcal{I}_d=\left\{\left(a_1, b_1\right] \times \cdots \times\left(a_d, b_d\right] \mid\left(a_i, b_i\right] \in \mathcal{I}, 1 \leq i \leq d\right\} \]

に対して\(\mathcal{B}_d = \sigma(\mathcal{I}_d)\)と作ることができる。これを \(d\)次元ボレル集合族 という。こうして \(d\)次元(ボレル)可測空間

\[ \left(\mathbb{R}^d, \mathcal{B}_d\right) \]

が得られる

確率変数#

標本の元\(\omega \in \Omega\)のことは根元事象とも呼ばれる。 例えばサイコロの目を\(X\)として、\(X(\omega_i) = i ~ (i=1,\dots,6)\)という対応を考える。\(X = i\)という観測(実現値 realization)を通して、背後に\(\omega_i\)という事象が起こっていたのだと考える。 よって、\(X: \Omega \to \mathbb{R}\)となるような対応があって、これが確率変数となる。

例えば\(X \in \{1, 6\}\)となるような「確率」を考えることは、事象\(\{ \omega_1, \omega_6 \}\)の「確率」を考えることになる。したがって\(\{\omega_1, \omega_6\} = X^{-1}(\{ 1,6 \})\in\mathcal{F}\)であることが要求される。

(少なくとも清水 (2021) では)以下の略記法が用いられる。

記法:写像 \(X: \Omega \rightarrow \mathbb{R}\) に対して,

\[ \{X \in B\}:=\{\omega \in \Omega \mid X(\omega) \in B\} (=X^{-1}(B)) \]

また, \(b>a>0\) に対して \(B=(a, b]\) のときには, \(\{a<X \leq b\}:=\{X \in(a, b]\}\) の ような記号も用いる.

定義(確率変数)

可測空間 \((\Omega, \mathcal{F})\) に対し、写像 \(X: \Omega \rightarrow \mathbb{R}^d\) が任意の \(B \in \mathcal{B}_d\) に対し

\[ \{X \in B\} \in \mathcal{F} \]

を満たすとき、 \(X\)\(\mathbb{R}^d\)-値 \((d\) 次元) 確率変数 (random variable) という。

※randam variableの訳語は「確率変数」だが、確率の定義に踏み入らずに定義される。

確率変数は可測関数#

確率変数は測度論における可測関数のこと。

定義(可測関数)

可測空間 \((\mathcal{X}, \mathcal{F})\) から \((\mathcal{Y}, \mathcal{G})\) への写像 \(f: \mathcal{X} \rightarrow \mathcal{Y}\) が 任意の \(A \in \mathcal{G}\) に対して

\[ f^{-1}(A) \in \mathcal{F} \]

を満たすとき、\(f\)\(\mathcal{X}\) 上の \(\mathcal{F}\)-可測関数 (measurable function) あるいは単 に \(\mathcal{F}\)-可測 といわれる。 \(f\) の行先の \(\sigma\)-加法族を強調するために \(\mathcal{F} / \mathcal{G}\)-可測 ということもある。 また \(\mathcal{X}=\mathbb{R}^d, \mathcal{F}=\mathcal{B}_d\) の場合には \(f\) を単に 可測関数 という。

よって確率変数は\(\Omega\)上の\(\mathcal{F}\)-可測関数である

定理

\(X\)\(d\) 次元確率変数とするとき、任意の可測関数 \(f: \mathbb{R}^d \rightarrow \mathbb{R}^k\) に対して、\(Y:=f(X)\)\(k\) 次元確率変数である。

証明

\(Y\)\(F / \mathcal{B}_k\)-可測であることを示せばよい。

\(Y\)\(Y=f \circ X\) なる合成写像であり、\((f \circ X)^{-1}(\cdot)=X^{-1}\left(f^{-1}(\cdot)\right)\) が成り立つことに注意すると、任意の \(B \in \mathcal{B}_k\) に対して、

\[ Y^{-1}(B)=(f \circ X)^{-1}(B)=X^{-1}\left(f^{-1}(B)\right) \in \mathcal{F} \]

を得る。 最後は \(f^{-1}(B) \in \mathcal{B}_d\)\(X: \Omega \rightarrow \mathcal{B}_d\)\(\mathcal{F}\)-可測性を用いた。