ルービンの因果モデル#
ルービンの因果モデル(rubin causal model)は潜在的結果と割当のメカニズムに着目して因果推論を検討するアプローチ(Rubin 1974, Holland 1986)。
用語#
潜在的結果#
ある個体が「介入を受けた場合」と「介入を受けなかった場合」の結果を、実際に介入があったかどうかに関わらず定めたものを潜在的結果(potential outcome)という。
対照群(control group):介入を受けなかった(
の)場合処置群(treatment group):介入を受けた(
の)場合個体
が介入を受けなかった時の潜在的結果:個体
が介入を受けた時の潜在的結果:
実際の観察結果は
次のように書くこともできる
因果効果#
因果の定義の仕方はいろいろあるが、ルービン因果モデルにおいては「ある個体が介入
個体
となる。
ただし、実際には実行された処置についての結果しか観測することができないため、
平均処置効果#
ITEの推定は難しいため、通常は平均での処置効果を推定することを考える
これを平均処置効果(average treatment effect: ATE)という。平均因果効果(average causal effect: ACE)という呼び方や、母集団レベルの議論であることを明示した母集団平均処置効果(population average treatment effect: PATE)という呼び方も存在する。
ATEの推定#
ナイーブな推定量#
素朴に思いつく推定方法は、観測できた各群の結果の平均値の差
を使って推定するアプローチであろう。 これは潜在的結果を使って表すと
となり、ATEとは異なる。仮にこれをナイーブな推定量と呼ぶことにして、
と表すことができる。
第1項の
処置群と対照群で平均的に処置効果に差がないと仮定すれば
となる。
第2項の
Note
もう少し厳密な話
ATT = ATEの仮定を置かずに厳密に書くと
となるらしい。ここで
また、
という関係がある。
導出
とおくと、
(参考:Causal Inference The Mixtape - 4 Potential Outcomes Causal Model)
例:ダイレクトメール(DM)配布
あるサービスの広告目的でDMを配布するとする。
このとき、あらかじめ(DM施策以前から)成約率が高いことがわかっているエリアのみに配布したらどうなるだろうか。
例えば、成約率の高いエリアはもともとの成約率が0.3で、実際に実験時点においても
実際に観測されたのは
だったとする。
両者の差分
しかし、DMが配布されたエリアはもともと成約率が高かったので、セレクション・バイアス

無作為割り当ての場合#
もし処置の割当
となり
になるため、ナイーブな推定量がATEの推定量となる。
回帰分析によるATE推定#
回帰分析は条件付き期待値
では回帰係数
強く無視できる割り当て条件#
共変量
を強く無視できる割り当て(strongly ignorable treatment assignment)条件という。
この条件が成立するとき、平均での独立性(mean independence)
が成立する。
そこから共変量について期待値をとればATEが推定できる
SUTVA条件#
個体
個体
の潜在的結果は、他の個体が受ける処置の値に依存しない個体
に対する処置は1通りに定まる
条件1について#
条件1は相互干渉がない(no interference)という言い方もされる(Cox 1958)。
相互干渉がある場合、個体
しかし現実には相互干渉が発生しうる。例えば労働者への教育プログラムの効果を推定する際には、他にもそのプログラムを受けて技能を向上させた労働者が多く現れる場合、労働市場における希少価値は低下し、結果として個体
条件2について#
条件2は処置の内容を明確にすることを要請している。
例えば「ダイエットをする」という処置では、具体的に何をしたのかが人によって大きく異なる可能性がある。
参考文献#
講義ノート#
[2305.18793] A First Course in Causal Inference(UCバークレーの講義ノート)