Model Class Reliance (MCR)

Model Class Reliance (MCR)#

Fisher et al. (2019). All models are wrong, but many are useful: Learning a variable’s importance by studying an entire class of prediction models simultaneously.

関連用語#

羅生門効果(Rashomon effect) :「ひとつの事象に対する見解が互いに矛盾してしまう状況」

羅生門集合(Rashomon set) :最適な訓練精度とほとんど変わらない精度を達成する予測モデルの集合

Model Class Reliance (MCR)#

羅生門集合を用いた、変数の重要度(variable importance: VI)の指標。

2つの特徴量\(X_1, X_2\)があるとする。\(X_1\)についての model reliance (MR) は観測値\((a),(b)\)があるうちの\(X_1\)の観測値だけ入れ替えたものへの訓練誤差ともともとの訓練誤差の比率っぽい(permutation importanceみたいな?)

\[\begin{split} M R(f) := \frac{e_{\text {switch }}(f)}{e_{\text {orig }}(f)} = \frac{\mathbb{E} \left[L \left\{f,\left(Y^{(b)}, X_1^{(a)}, X_2^{(b)}\right)\right\} \right]} {\mathbb{E} \left[ L\left\{f,\left(Y, X_1, X_2\right)\right\} \right]}\\ = \frac{ \text{ Expected loss of} ~ f \text{ under noise} } { \text{ Expected loss of} ~ f \text{ without noise } } \end{split}\]

model class reliance (MCR) はそれらのRashomon set \(\mathcal{R}(\epsilon)\) の中での最小値・最大値

\[ \left[M C R_{-}(\epsilon), M C R_{+}(\epsilon)\right]:=\left[\min _{f \in \mathcal{R}(\epsilon)} M R(f), \max _{f \in \mathcal{R}(\epsilon)} M R(f)\right] \]

参考#