処置後変数バイアス#
Post-treatment variable bias(処置後変数バイアス) とは、処置(treatment)の影響をすでに受けている変数をコントロール(回帰モデルで調整)してしまうことで生じるバイアス。
処置後変数とは#
処置後変数は、処置\(T\)のあとに決まる、処置の影響を受ける変数の総称
を満たす\(X\)のこと。
例:中間変数#
例えば、処置\(T\)、結果\(Y\)、中間変数(mediator)\(M\)があり、
となる因果関係がある場合、\(M\)は処置後に決まる変数なので処置後変数(\(Y\)も処置後変数)
生じる問題#
中間変数\(M\)を回帰モデルに含めると、どういう問題が起こるか
1. 処置の効果ではなく中間変数の効果を推定することになる#
データの生成過程が
であったとき、\(M\)を回帰モデルに含めると
\(T\to Y\)の経路を途中で遮断するため、\(M\to Y\)の直接効果しか推定されなくなる
2. コライダーバイアスを生む場合もある#
データの生成過程が、未観測の変数\(U\)を含み
となっているとする。
\(T \to Y\)への影響がないので\(M\)をコントロールしなければ\(T \to Y\)の効果はないと推定される。
しかし\(M\)をコントロールすると\(T\to Y\)のパスが生まれ、効果があるという推定結果になる(collider bias, 合流点バイアス)
対応#
原則、「処置後に決まる変数はコントロールしない」
参考#
Montgomery, J. M., Nyhan, B., & Torres, M. (2018). How conditioning on posttreatment variables can ruin your experiment and what to do about it. American Journal of Political Science, 62(3), 760-775.
矢内勇生「欠落変数バイアスと処置後変数バイアス」