予測モデルの評価#

様々な誤差の指標#

汎化誤差#

訓練データ\(\mathcal{T} = \{(x_i, y_i)\}_{i=1}^n\)のもとでのモデル\(\hat{f}\)の**真の誤差(true error)あるいは汎化誤差(generatization error)**とは、真の分布で誤差関数の期待値をとったもの

\[ \text{GE} = E_{X^0, Y^0} [ L(Y^0, \hat{f}(X^0) ) | \mathcal{T} ] \]

ここで\((X^0, Y^0)\)は新しいデータ点。

期待誤差#

訓練セットで汎化誤差の期待値をとった

\[ \text{EE} = E_{\mathcal{T}}E_{X^0, Y^0} [ L(Y^0, \hat{f}(X^0) ) | \mathcal{T} ] \]

を**期待誤差(expected error)**という。

期待誤差のほうが統計的に扱いやすい

訓練誤差#

訓練データで誤差の平均値をとったもの

\[ \text{TE} = \frac{1}{N} \sum^N_{i=1} L(y_i, \hat{f}(x_i)) \]

を**訓練誤差(training error)あるいは再代入誤り率(redistribution error)**という。

訓練誤差は汎化誤差以下になることが知られている

参考#

カステラ本 ch7.4