ルービンの因果モデル#

ルービンの因果モデル(rubin causal model)は潜在的結果と割当のメカニズムに着目して因果推論を検討するアプローチ(Rubin 1974, Holland 1986)。

用語#

潜在的結果#

ある個体が「介入を受けた場合」と「介入を受けなかった場合」の結果を、実際に介入があったかどうかに関わらず定めたものを潜在的結果(potential outcome)という。

  • 対照群(control group):介入を受けなかった(D=0の)場合

  • 処置群(treatment group):介入を受けた(D=1の)場合

  • 個体iが介入を受けなかった時の潜在的結果:Yi(0)

  • 個体iが介入を受けた時の潜在的結果:Yi(1)

実際の観察結果はYiとする

Yi={Yi(0) if Di=0Yi(1) if Di=1

次のように書くこともできる

Yi=Yi(Di)=Yi(0)(1Di)+Yi(1)D

因果効果#

因果の定義の仕方はいろいろあるが、ルービン因果モデルにおいては「ある個体が介入Dを受けた場合に、受けなかった場合の結果Yと比べた結果Y1の差Y1Y0」を「D因果効果(causal effect)」とする。なお、因果効果と同様の意味で処置効果(treatment effect)という言葉も使われる。

個体iの因果効果(個体処置効果 individual treatment effect: ITE) は

τi=Yi(1)Yi(0)

となる。

ただし、実際には実行された処置についての結果しか観測することができないため、τiは観測することはできない。このことは因果推論の根本問題と呼ばれる。

平均処置効果#

ITEの推定は難しいため、通常は平均での処置効果を推定することを考える

τ=E[Y(1)Y(0)]=E[Y(1)]E[Y(0)]

これを平均処置効果(average treatment effect: ATE)という。平均因果効果(average causal effect: ACE)という呼び方や、母集団レベルの議論であることを明示した母集団平均処置効果(population average treatment effect: PATE)という呼び方も存在する。

ATEの推定#

ナイーブな推定量#

素朴に思いつく推定方法は、観測できた各群の結果の平均値の差

1N1i:Di=1N1yi1N0i:Di=0N0yi

を使って推定するアプローチであろう。 これは潜在的結果を使って表すと

τnaive=E[Y(1)|D=1]E[Y(0)|D=0]

となり、ATEとは異なる。仮にこれをナイーブな推定量と呼ぶことにして、τnaiveと表す。 これはE[Y(0)|D=1]を足して引くと

τnaive=E[Y(1)|D=1]E[Y(0)|D=0]=E[Y(1)|D=1]E[Y(0)|D=1]+E[Y(0)|D=1]E[Y(0)|D=0]=E[Y(1)Y(0)|D=1]ATT+E[Y(0)|D=1]E[Y(0)|D=0]Selection Bias

と表すことができる。

第1項のE[Y(1)Y(0)|D=1]は処置群における「処置を受けたときの結果Y(0)」と「処置を受けなかった場合の(反実仮想の)結果Y(0)」の差である。これを処置群に対する平均処置効果(average treatment effect on the treated: ATT or ATET)という。

処置群と対照群で平均的に処置効果に差がないと仮定すれば

E[Y(1)Y(0)]ATE=E[Y(1)Y(0)|D=1]P(D=1)+E[Y(1)Y(0)|D=0]P(D=0)=E[Y(1)Y(0)|D=1]{P(D=1)+P(D=0)}=E[Y(1)Y(0)|D=1]ATT

となる。

第2項のE[Y(0)|D=1]E[Y(0)|D=0]は、「処置群が仮に処置を受けなかったとした場合の結果の期待値」と「対照群が処置を受けなかった場合の期待値」の差であり、セレクション・バイアス(selection bias)と呼ばれる。 もしセレクション・バイアスが0であればτnaive=ATTであり、さらにATT=ATEであればτnaive=ATE=τになる。そうでない場合はτnaiveτであり、単純な各群の期待値の差をとる方法は誤った分析結果を導くことになる。

Note

もう少し厳密な話

ATT = ATEの仮定を置かずに厳密に書くと

E[Y(1)|D=1]E[Y(0)|D=0]τnaive=E[Y(1)]E[Y(0)]ATE+E[Y(0)|D=1]E[Y(0)|D=0]Selection bias+(1π)(ATTATU)Heterogeneous treatment effect bias

となるらしい。ここでπは処置を受ける割合であり、ATUは対照群における平均処置効果である。

また、

ATE=πATT+(1π)ATU

という関係がある。

導出
E[Y1D=1]=aE[Y1D=0]=bE[Y0D=1]=cE[Y0D=0]=dATE=e

とおくと、

e={πa+(1π)b}{πc+(1π)d}e=πa+bπbπcd+πde=πa+bπbπcd+πd+(aa)+(cc)+(dd)0=eπab+πb+πc+dπda+ac+cd+dad=eπab+πb+πc+dπd+ac+cdad=e+(cd)+aπab+πbc+πc+dπdad=e+(cd)+(1π)a(1π)b+(1π)d(1π)cad=e+(cd)+(1π)(ac)(1π)(bd)

(参考:Causal Inference The Mixtape - 4  Potential Outcomes Causal Model

例:ダイレクトメール(DM)配布

あるサービスの広告目的でDMを配布するとする。

このとき、あらかじめ(DM施策以前から)成約率が高いことがわかっているエリアのみに配布したらどうなるだろうか。

例えば、成約率の高いエリアはもともとの成約率が0.3で、実際に実験時点においてもE[Y(0)|D=1]=0.3だったとする

実際に観測されたのは

E[Y|D=1]=0.4E[Y|D=0]=0.2

だったとする。

両者の差分τnaive0.40.2=0.2となる。

しかし、DMが配布されたエリアはもともと成約率が高かったので、セレクション・バイアスE[Y(0)|D=1]E[Y(0)|D=0]0.30.2=0.1となり、τnaiveは0.1だけ過大にATEを推定していることになる。

../_images/2c97956581110049c7f9a982f7e60a2a5523abf51f190c17bbfe59621ddbf285.png

無作為割り当ての場合#

もし処置の割当Dが無作為(ランダム)であれば潜在的結果Y(0),Y(1)とは独立

(Y(0),Y(1))D

となり

E[Y(0)|D=0]=E[Y(0)]E[Y(1)|D=1]=E[Y(1)]

になるため、ナイーブな推定量がATEの推定量となる。

回帰分析によるATE推定#

回帰分析は条件付き期待値E[Y|D,X]を推定する方法であるため、二値変数の割当変数D{0,1}を説明変数に含めた

Y=τD+Xβ+ε

では回帰係数τは切片の違いすなわち両群の平均の差を表現しているため、τをATEの推定値と解釈することができる。

強く無視できる割り当て条件#

共変量Xを条件付けた下での処置割当Dと結果Y(0),Y(1)の独立(条件付き独立 conditional independence)

(Y(0),Y(1))D|X

強く無視できる割り当て(strongly ignorable treatment assignment)条件という。

この条件が成立するとき、平均での独立性(mean independence)

E[Y|D=0,X]=E[Y(0)|D,X]=E[Y(0)|X]E[Y|D=1,X]=E[Y(1)|D,X]=E[Y(1)|X]

が成立する。

そこから共変量について期待値をとればATEが推定できる

EX[E[Y(1)Y(0)|X]]=E[Y(1)Y(0)]

SUTVA条件#

個体iの潜在的結果Yi(1),Yi(0)が次の2つの条件を満たすとき、SUTVA(stable unit treatment value assumption)条件を満たすという(Rubin 1980)。

  1. 個体iの潜在的結果は、他の個体が受ける処置の値に依存しない

  2. 個体iに対する処置は1通りに定まる

条件1について#

条件1は相互干渉がない(no interference)という言い方もされる(Cox 1958)。

相互干渉がある場合、個体iの潜在的結果は個体iの処置Diだけでは定まらず、Yi(D1,,Dn)のように書く必要が出てきてかなり複雑になる。 そのため、条件1は潜在的結果をシンプルに扱うための条件となる。

しかし現実には相互干渉が発生しうる。例えば労働者への教育プログラムの効果を推定する際には、他にもそのプログラムを受けて技能を向上させた労働者が多く現れる場合、労働市場における希少価値は低下し、結果として個体iの潜在的結果に影響を与えると考えられる。

条件2について#

条件2は処置の内容を明確にすることを要請している。

例えば「ダイエットをする」という処置では、具体的に何をしたのかが人によって大きく異なる可能性がある。

参考文献#

講義ノート#