予測モデルの評価#

様々な誤差の指標#

汎化誤差#

訓練データT={(xi,yi)}i=1nのもとでのモデルf^の**真の誤差(true error)あるいは汎化誤差(generatization error)**とは、真の分布で誤差関数の期待値をとったもの

GE=EX0,Y0[L(Y0,f^(X0))|T]

ここで(X0,Y0)は新しいデータ点。

期待誤差#

訓練セットで汎化誤差の期待値をとった

EE=ETEX0,Y0[L(Y0,f^(X0))|T]

を**期待誤差(expected error)**という。

期待誤差のほうが統計的に扱いやすい

訓練誤差#

訓練データで誤差の平均値をとったもの

TE=1Ni=1NL(yi,f^(xi))

を**訓練誤差(training error)あるいは再代入誤り率(redistribution error)**という。

訓練誤差は汎化誤差以下になることが知られている

参考#

カステラ本 ch7.4