分散安定化変換#
分散安定化変換(variance-stabilizing transformation) は確率変数の分散を制御して分析しやすくする手法
比率のアークサイン変換#
標本比率 \(\hat{p}\) の分散(標準誤差)は
\[
\operatorname{Var}(\hat{p}) = \frac{p (1 - p)}{n}
\]
であり、\(p=0.5\)で最大になり、\(p\)が0や1に近い両端の部分では分散が小さくなる → 比率\(p\)の値に応じて分散が異なり、扱いにくい
そこで分散を安定化(variance-stabilizing)したい。
このようなときは\(\sin\)の逆関数である\(\arcsin\)関数によって標本比率の平方根を変換する方法がある
アークサイン変換
\[
\arcsin( \sqrt{ \hat{p} })
\]
関数の微分で分散を近似する手法である デルタ法(Delta method)
\[
\operatorname{Var}(f(\hat{p})) \approx\left(f^{\prime}(p)\right)^2 \cdot \operatorname{Var}\left(\hat{p}\right)
\]
でアークサイン変換後の分散を近似すると
\[\begin{split}
\begin{aligned}
f(p) &=\arcsin (\sqrt{p})\\
f^{\prime}(p) &=\frac{1}{2 \sqrt{p} \sqrt{1-p}}\\
\end{aligned}
\end{split}\]
なので
\[\begin{split}
\begin{aligned}
\operatorname{Var}(f(\hat{p}))
& \approx \left(\frac{1}{2 \sqrt{p(1-p)}}\right)^2 \cdot \frac{p(1-p)}{n}\\
&= \frac{1}{4 p(1-p)} \cdot \frac{p(1-p)}{n}\\
&= \frac{1}{4n}\\
\end{aligned}
\end{split}\]
となり、\(\hat{p}\) に依存せず、同じサンプルサイズのもとでは同じ分散(標準誤差)となる