確率変数と期待値・分散#
確率変数#
\(\Omega\)を全事象、\(\mathcal{B}\)を\(\Omega\)の可測集合族、\(P\)を\((\Omega, \mathcal{B})\)上の確率とするとき、\(\omega \in \Omega\)に対して実数値\(X(\omega) \in \mathbb{R}\)を対応させる関数\(X\)を確率変数(random variable)という。
任意の実数\(x\)に対して\(X\leq x\)である確率は
として、確率\(P\)を用いて与えることができる。
なお、\(X(\omega)=x\)の\(x\)を実現値という。実現値の全体を標本空間といい、\(\mathcal{X} = \{X(\omega)|\omega\in\Omega\}\)で表す。
累積分布関数#
確率変数Xの累積分布関数(cumulative distribution function: cdf)を
と定義する。累積分布関数は単に分布関数とも呼ばれる。
分布関数\(F_X(x)\)が階段関数(step function)のとき、\(X\)は離散型確率変数(discrete random variable)といい、\(F_X(x)\)が連続関数のとき、\(X\)は連続型確率変数(continuous random variable)という。
確率関数#
離散型確率変数\(X\)に対して
を確率質量関数(probability mass function: pmf)という。
連続型確率変数\(X\)に対して
となる関数\(f_X(x)\)が存在するとき、\(f_X(x)\)を確率密度関数(probability density function: pdf)という。
定義から、\(f_X(x)\)は\(F_X(x)\)を微分することで得られる。
期待値#
確率変数\(X\)の関数\(g(X)\)の期待値(expected value)を\(E[g(X)]\)で表す。\(E[g(X)]\)は
\(X\)が離散型確率変数のとき、
\(X\)が連続型確率変数のとき、
と定義される。
\(E[X]\)を\(X\)の期待値もしくは平均(mean)という。
期待値の演算規則#
線形関数のため、線形性をもつ
\(a,b\in\mathbb{R}\)による線形関数\(g(X) = a+bX\)の期待値を考える
証明
例として離散型確率変数とする
分散#
\(E[(X- E[X])^2]\)を\(X\)の分散(variance)という。
証明
分散も線形関数のため、線形性をもつ
\(a,b\in\mathbb{R}\)に対し、
多次元確率変数の分布#
2つの確率変数\(X,Y\)の組を考える。
離散分布の場合#
同時分布#
\(X,Y\)がどちらも離散型確率変数で、\(X\)が\(\mathcal{X}=\{0,1,2,...\}\)上に、\(Y\)が\(\mathcal{Y}=\{0,1,2,...\}\)上に値をとるとする。\(X=x\)かつ\(Y=y\)である確率\(P(\{X=x\}\cap\{Y=y\})\)を\(P(X=x, Y=y)\)で表し、
と書くことにする。
\(X,Y\)と2次元の確率変数の場合、事象も2次元空間にあり、\((x,y)\)の集まった部分集合になる。ある事象\(A\)の確率は
と書くことができる。これを同時分布(joint distribution)といい、\(f_{X,Y}(x,y)\)を同時確率関数(joint probability function)という。
周辺分布#
\(\mathcal{X}\)上の集合\(B\)に対して\(\{X \in B\}\)という事象は\(\{X \in B\}\cap\{Y \in \mathcal{Y}\}\)もしくは\(\{(X,Y) \in B\times\mathcal{Y}\}\)と同等なので、
と書くことができる。\(P(X\in B)\)を\(X\)の周辺分布(marginal distribution)といい、
を\(X\)の周辺確率関数 という。
期待値#
関数\(g(X,Y)\)の同時確率関数\(f_{X,Y}(x,y)\)に関する期待値は次のように定義される。
連続分布の場合#
同時確率#
\(X,Y\)がともに\(\mathbb{R}\)上の連続型確率変数とし、\(\mathbb{R}^2\)上の集合\(C\)に対して確率が
と表されるとき、\(f_{X,Y}(x,y)\)を同時確率密度関数(joint probability density function)という。
周辺確率#
\(X\)の周辺確率密度関数(marginal probability density function)は
で与えられる。
期待値#
次のように定義される
条件付き確率・期待値#
条件付き確率#
\(f_X(x)\neq 0\)なる\(x\)に対して、\(X=x\)のもとでの\(Y=y\)の条件付き確率を
と定義する
条件付き期待値#
離散型
連続型確率分布において、関数\(g(x, y)\)に対する条件付き期待値は
となる。
条件付き分散#
繰り返し期待値の法則#
条件付き期待値\(E[Y|X]\)を\(X\)について期待値をとったものは\(E[Y]\)に等しい。すなわち、
である。これを 繰り返し期待値の法則 (the law of total expectation, the law of iterated expectations: LIE)という。
証明:
期待値ベクトル#
\(X = (X_1,\dots,X_n)^\top\) を\(n\)次元確率変数ベクトルとする。各変数の期待値のベクトル
を期待値ベクトルという。
分散共分散行列#
\(a\)を定数ベクトル、\(B\)を定数行列とすると
となる。
証明
参考#
久保川 達也(2017)『現代数理統計学の基礎』、共立出版。