処置後変数バイアス

処置後変数バイアス#

Post-treatment variable bias（処置後変数バイアス） とは、処置（treatment）の影響をすでに受けている変数をコントロール（回帰モデルで調整）してしまうことで生じるバイアス。

処置後変数は、処置\(T\)のあとに決まる、処置の影響を受ける変数の総称

\[ T \to X \]

を満たす\(X\)のこと。

例えば、処置\(T\)、結果\(Y\)、中間変数（mediator）\(M\)があり、

\[ T \to M \to Y \]

となる因果関係がある場合、\(M\)は処置後に決まる変数なので処置後変数（\(Y\)も処置後変数）

中間変数\(M\)を回帰モデルに含めると、どういう問題が起こるか

データの生成過程が

\[ T \to M \to Y \]

であったとき、\(M\)を回帰モデルに含めると

\[ Y=\beta_0+\beta_1 T+\beta_2 M+\epsilon \]

\(T\to Y\)の経路を途中で遮断するため、\(M\to Y\)の直接効果しか推定されなくなる

データの生成過程が、未観測の変数\(U\)を含み

\[ T \to M \leftarrow U \to Y \]

となっているとする。

\(T \to Y\)への影響がないので\(M\)をコントロールしなければ\(T \to Y\)の効果はないと推定される。
しかし\(M\)をコントロールすると\(T\to Y\)のパスが生まれ、効果があるという推定結果になる（collider bias, 合流点バイアス）

原則、「処置後に決まる変数はコントロールしない」