因果ダイアグラム#

因果関係のグラフィカルモデルとPearl流の因果推論のフレームワークについて。

構造的因果モデル#

構造的因果モデル(SCM:Structural Causal Model):変数間の因果関係をグラフで記述するモデル

例えば教育年数\(X\)と職務経験年数\(Z\)が給料\(Y\)に与える影響が

\[ Y = \beta X + \gamma Z \]

というふうになっていたとする。

グラフィカルモデルは以下のようになる

../_images/117e1afb8677686b33ab1a3de06c7507d6add38b2b5b363a2e57220e2c0b2cbe.svg

介入・do演算子#

条件付確率のような条件付けは、介入とは異なる。

介入はある変数を実際にその値に設定した場合を見ている。一方、条件付けはその条件を満たすものに焦点を絞って見ているに過ぎず、変数の値を変えているわけではない。

\(P(Y=y|X=x)\)\(X=x\)であるという条件のもとで\(Y=y\)となる確率のこと。

\(P(Y=y|do(X=x))\)は介入により\(X=x\)としたとき\(Y=y\)となる確率のこと。

平均因果効果#

ある処置\(X\)を行うことを\(do(X=1)\)、処置を行わないことを\(do(X=0)\)とすると、平均因果効果(ACE: average causal effect)は

\[ P(Y=1|do(X=1)) - P(Y=1|do(X=0)) \]

と表される。

調整#

グラフ \(G\) において \(X\) の親を \(PA\) とすると、 \(X\)\(Y\) に及ぼす因果効果は

\[ P(Y=y \mid do(X=x))=\sum_z P(Y=y \mid X=x, PA=z) P(PA=z) \]

で与えられる。ここで\(z\)\(PA\)に含まれる変数がとりうるすべての組み合わせである。

逆確率重み付け法#

なお、それぞれの項に\(P(X=x\mid PA=z)\)を掛けて割ることにより、

\[\begin{split} \begin{align} P(Y=y \mid do(X=x)) &= \sum_z P(Y=y \mid X=x, PA=z) P(PA=z) \frac{P(X=x\mid PA=z)}{P(X=x\mid PA=z)}\\ &= \sum_z \frac{ P(Y=y \mid X=x, PA=z) P(X=x\mid PA=z) P(PA=z)}{P(X=x\mid PA=z)}\\ &= \sum_z \frac{ P(Y=y, X=x, PA=z) }{P(X=x\mid PA=z)}\\ \end{align} \end{split}\]

を得る。

\(P(X=x\mid PA=z)\)傾向スコア(propensity score)と呼ばれる。

介入前における\((X, Y, PA)\)の同時確率を\(1 / P(X=x\mid PA=z)\)倍しているため、この方法は逆確率重み付け法と呼ばれる。 標本を\(1 / P(X=x\mid PA=z)\)倍して、あたかも介入後の分布から抽出したものであるかのように扱うことによって\(P(Y=y \mid do(X=x))\)を推定する。

例えば、\(X\)\(Y\)の共通の親に\(Z\)があるとする。

../_images/4c3a8218552417cfbd43029a68203e6f5a1138dfdb9015f92ef9766855cd8ff1.svg

このとき、

\[ P(Y=y \mid do(X=x))=\sum_z P(Y=y \mid X=x, Z=z) P(Z=z) \]

となる。この式は調整化公式とよばれ、このような処理は「\(Z\)による調整」「\(Z\)についてのコントロール」と呼ばれる。

バックドア基準#

定義(バックドア基準)

非巡回的有向グラフ\(G\)において変数の順序対\((X, Y)\)が与えられたとき、変数の集合\(Z\)に含まれるいかなるノードも\(X\)の子孫ではなく、かつ\(X\)\(Y\)の間の道で\(X\)に向かう矢線を含むようなものすべてを\(Z\)がブロックするとき、\(Z\)\((X,Y)\)についてバックドア基準を満たすという。

変数\(Z\)\(X\)\(Y\)についてバックドア基準を満たすとき、\(X \to Y\)の因果効果は

\[ P(Y=y \mid do(X=x))=\sum_z P(Y=y \mid X=x, Z=z) P(Z=z) \]

で得られる。

一般に、以下の条件を満たすようなノードの集合\(Z\)について条件付けをおこないたい。

  1. XとYの間の擬似パス(バックドアパス)すべてブロックする

  2. XからYへの有向道は変更しない

  3. 新たな擬似パスは作成しない

フロントドア基準#

定義(フロントドア)

変数の集合 \(Z\) が以下の条件を満たすとき, \(Z\) は順序対 \((X, Y)\) についてフロントドア基準を満たす。

  1. \(Z\)\(X\) から \(Y\)への有向道をすべてブロックする

  2. \(X\) から \(Z\) へのバックドアパスは存在しない.

定理(フロントドア調整)

\(Z\)\((X, Y)\)についてのフロントドア基準を満たし、\(P(x, z) > 0\)であるならば、\(X\)から\(Y\)への因果効果は識別可能であり、以下の式で与えられる。

\[ P(y \mid d o(x))=\sum_z P(z \mid x) \sum_{x^{\prime}} P\left(y \mid x^{\prime}, z\right) P\left(x^{\prime}\right) \]

参考文献#