削減不能な誤差の推定#
バイアス‐バリアンス分解#
定理
目的変数\(Y\)が回帰関数\(f(X)\)と誤差\(\varepsilon\)によって分解できる、すなわち\(Y=f(X)+\varepsilon\)であるとする。ここで\(\mathrm{E}(\varepsilon)=0, \ \mathrm{Var}(\varepsilon) = \sigma^2_{\varepsilon}\)である。
入力点\(X=x_0\)における学習した回帰関数\(\hat{f}(X)\)の二乗誤差の期待値は、 削減不能な誤差 (irreducible error) 、 バイアス(Bias) の二乗、 バリアンス(Variance) に分解できる。
証明
\[\begin{split}
\begin{aligned}
\operatorname{Err}\left(x_0\right)
&= \mathrm{E} \left[\left(Y-\hat{f}\left(x_0\right)\right)^2 \mid X=x_0\right] \\
& =\sigma_{\varepsilon}^2+\left[\mathrm{E} \hat{f}\left(x_0\right)-f\left(x_0\right)\right]^2+E\left[\hat{f}\left(x_0\right)-\mathrm{E} \hat{f}\left(x_0\right)\right]^2 \\
& =\sigma_{\varepsilon}^2+\operatorname{Bias}^2\left(\hat{f}\left(x_0\right)\right)+\operatorname{Var}\left(\hat{f}\left(x_0\right)\right) \\
& =\text { Irreducible Error }+\operatorname{Bias}^2+\text { Variance. }
\end{aligned}
\end{split}\]
もし、現状のデータとモデルではそれ以上誤差を削減させられないなら、モデルのフィッティングを頑張るよりも特徴量を増やす努力をしたほうがよいかもしれない。
削減不能な誤差の推定#
削減不能な誤差をどう推定するか?