因果ダイアグラム#

因果関係のグラフィカルモデルとPearl流の因果推論のフレームワークについて。

構造的因果モデル#

構造的因果モデル(SCM:Structural Causal Model):変数間の因果関係をグラフで記述するモデル

例えば教育年数Xと職務経験年数Zが給料Yに与える影響が

Y=βX+γZ

というふうになっていたとする。

グラフィカルモデルは以下のようになる

../_images/117e1afb8677686b33ab1a3de06c7507d6add38b2b5b363a2e57220e2c0b2cbe.svg

介入・do演算子#

条件付確率のような条件付けは、介入とは異なる。

介入はある変数を実際にその値に設定した場合を見ている。一方、条件付けはその条件を満たすものに焦点を絞って見ているに過ぎず、変数の値を変えているわけではない。

P(Y=y|X=x)X=xであるという条件のもとでY=yとなる確率のこと。

P(Y=y|do(X=x))は介入によりX=xとしたときY=yとなる確率のこと。

平均因果効果#

ある処置Xを行うことをdo(X=1)、処置を行わないことをdo(X=0)とすると、平均因果効果(ACE: average causal effect)は

P(Y=1|do(X=1))P(Y=1|do(X=0))

と表される。

調整#

グラフ G において X の親を PA とすると、 XY に及ぼす因果効果は

P(Y=ydo(X=x))=zP(Y=yX=x,PA=z)P(PA=z)

で与えられる。ここでzPAに含まれる変数がとりうるすべての組み合わせである。

逆確率重み付け法#

なお、それぞれの項にP(X=xPA=z)を掛けて割ることにより、

P(Y=ydo(X=x))=zP(Y=yX=x,PA=z)P(PA=z)P(X=xPA=z)P(X=xPA=z)=zP(Y=yX=x,PA=z)P(X=xPA=z)P(PA=z)P(X=xPA=z)=zP(Y=y,X=x,PA=z)P(X=xPA=z)

を得る。

P(X=xPA=z)傾向スコア(propensity score)と呼ばれる。

介入前における(X,Y,PA)の同時確率を1/P(X=xPA=z)倍しているため、この方法は逆確率重み付け法と呼ばれる。 標本を1/P(X=xPA=z)倍して、あたかも介入後の分布から抽出したものであるかのように扱うことによってP(Y=ydo(X=x))を推定する。

例えば、XYの共通の親にZがあるとする。

../_images/4c3a8218552417cfbd43029a68203e6f5a1138dfdb9015f92ef9766855cd8ff1.svg

このとき、

P(Y=ydo(X=x))=zP(Y=yX=x,Z=z)P(Z=z)

となる。この式は調整化公式とよばれ、このような処理は「Zによる調整」「Zについてのコントロール」と呼ばれる。

バックドア基準#

定義(バックドア基準)

非巡回的有向グラフGにおいて変数の順序対(X,Y)が与えられたとき、変数の集合Zに含まれるいかなるノードもXの子孫ではなく、かつXYの間の道でXに向かう矢線を含むようなものすべてをZがブロックするとき、Z(X,Y)についてバックドア基準を満たすという。

変数ZXYについてバックドア基準を満たすとき、XYの因果効果は

P(Y=ydo(X=x))=zP(Y=yX=x,Z=z)P(Z=z)

で得られる。

一般に、以下の条件を満たすようなノードの集合Zについて条件付けをおこないたい。

  1. XとYの間の擬似パス(バックドアパス)すべてブロックする

  2. XからYへの有向道は変更しない

  3. 新たな擬似パスは作成しない

フロントドア基準#

定義(フロントドア)

変数の集合 Z が以下の条件を満たすとき, Z は順序対 (X,Y) についてフロントドア基準を満たす。

  1. ZX から Yへの有向道をすべてブロックする

  2. X から Z へのバックドアパスは存在しない.

定理(フロントドア調整)

Z(X,Y)についてのフロントドア基準を満たし、P(x,z)>0であるならば、XからYへの因果効果は識別可能であり、以下の式で与えられる。

P(ydo(x))=zP(zx)xP(yx,z)P(x)

参考文献#