処置後変数バイアス#

Post-treatment variable bias(処置後変数バイアス) とは、処置(treatment)の影響をすでに受けている変数をコントロール(回帰モデルで調整)してしまうことで生じるバイアス。

処置後変数とは#

処置後変数は、処置\(T\)のあとに決まる、処置の影響を受ける変数の総称

\[ T \to X \]

を満たす\(X\)のこと。

例:中間変数#

例えば、処置\(T\)、結果\(Y\)、中間変数(mediator)\(M\)があり、

\[ T \to M \to Y \]

となる因果関係がある場合、\(M\)は処置後に決まる変数なので処置後変数(\(Y\)も処置後変数)

生じる問題#

中間変数\(M\)を回帰モデルに含めると、どういう問題が起こるか

1. 処置の効果ではなく中間変数の効果を推定することになる#

データの生成過程が

\[ T \to M \to Y \]

であったとき、\(M\)を回帰モデルに含めると

\[ Y=\beta_0+\beta_1 T+\beta_2 M+\epsilon \]

\(T\to Y\)の経路を途中で遮断するため、\(M\to Y\)の直接効果しか推定されなくなる

2. コライダーバイアスを生む場合もある#

データの生成過程が、未観測の変数\(U\)を含み

\[ T \to M \leftarrow U \to Y \]

となっているとする。

\(T \to Y\)への影響がないので\(M\)をコントロールしなければ\(T \to Y\)の効果はないと推定される。
しかし\(M\)をコントロールすると\(T\to Y\)のパスが生まれ、効果があるという推定結果になる(collider bias, 合流点バイアス)

対応#

原則、「処置後に決まる変数はコントロールしない」

参考#