検出力#
検定での意思決定の誤り#
検定の意思決定の誤り#
母数空間\(\Theta\)が互いに排反な2つの部分集合\(\Theta_0, \Theta_1\)に分けられているとする。未知の母数\(\theta\)についての帰無仮説\(H_0\)と対立仮説\(H_1\)を以下のように表す。
帰無仮説を受容する意思決定を\(d=0\)、帰無仮説を棄却する決定を\(d=1\)と表すことにし、それらの集合(決定空間)は\(D=\{0, 1\}\)と表すことにする。
帰無仮説が正しいとき \((\theta \in \Theta_0)\) に帰無仮説を枼却する \((d=1)\) 誤りを 第1種の過誤(error of the first kind) や 偽陽性 とよぶ。また対立仮説が正しいとき \((\theta \in \Theta_1)\) に帰無仮説を受容する \((d=0)\) 誤りを 第2種の過誤(error of the second kind) や 偽陰性 とよぶ。
第1種の過誤(type I error)
帰無仮説が正しいのに帰無仮説を棄却してしまう誤り。
これを犯す確率が有意水準\(\alpha\)
第2種の過誤(type II error)
帰無仮説が正しくないのに帰無仮説を受容してしまう誤り。こちらは\(\beta\)で表される。
これら2種類の誤りを統一的に表現する関数が検出力関数
損失関数#
実際には正しくない仮説を採択する意思決定をとったときを「損失」として表し、意思決定の損失関数を以下のような損失関数\(L(\theta, d)\)で表現することにする。
(※第1種の過誤を犯したとき\(a\)の損失が、第2種の過誤を犯したとき\(b\)の損失が得られるということ。)
検出力関数#
検定問題における決定関数 (検定関数 test function とよばれる) を\(\delta: \mathcal{X} \to D\)とおく。検定関数\(\delta\)は\(X=x\)を観測したとき帰無仮説を棄却するなら1、受容するなら0をとる関数。
損失関数の期待値である リスク関数 は \(R(\theta, \delta) = E_{\theta}[L(\theta, \delta(X))]\)と定義される。
ところで、
と定義すると、\(\delta\)のリスク関数は以下のように表すことができる。
\(\beta_\delta(\theta)\)を 検出力関数(power function) といい、その値を 検出力(power) という。
Note
\(R(\theta, \delta)\)の1行目は第1種の過誤の確率を意味する。実際には帰無仮説が正しい(\(\theta \in \Theta_0\)の)ときに\(d=\delta(X)=1\)なのが第1種の過誤なので。
\(R(\theta, \delta)\)の2行目は第2種の過誤の確率を意味する。実際には対立仮説が正しい(\(\theta \in \Theta_1\)の)ときに\(d=\delta(X)=0\)の確率\(1-\beta_\delta(\theta)\)なので。
10個の製品を検査して、もし1個以上の不良品があれば帰無仮説 \(H_0: p \leq p_0\) を棄却するとする(なお \(p_0 = 0.01\)と想定する)
この場合の検定関数は
となる。\(X\)は2項分布\(B(10, p)\)に従うと考えればよいので、検出力関数は
で与えられる。\(p_0 = 0.01\)のとき\(\beta_\delta(p) = 1-(1-p)^{10} = 0.0956\)