Austen plot#
Veitch & Zaveri (2020) は Imbens (2003) のPartial R2を一般化し、 Austen plot(オースティン・プロット) という図で視覚的に示す方法を提案した。
長所は
未観測の交絡因子が1つでも複数でも対応可能
非線形モデルにも対応可能
(Partial R2は線形モデルで、1つの交絡因子のみが対象だった)
短所は
大体の傾向しか出せない
サンプル数が小さいと精度が低い
理論の概要#
Sensitivity Model#
Imbens (2003)と同様に、未観測の交絡因子\(U\)をベルヌーイ分布に従う存在としてモデル化し、処置\(T\)や結果\(Y\)への\(U\)の影響を含めたモデルを構築する。
\[\begin{split}
\begin{gathered}
U_i \stackrel{i i d}{\sim} \operatorname{Bern}(1/2)
\\
T(X, U) \stackrel{\text { ind }}{\sim} \operatorname{Bern}(\hat{g}(X, U))
\\
E[Y \mid X, T, U] = Q(T, X)+\delta(\operatorname{logit} \hat{g}(X, U)-E[\operatorname{logit} \hat{g}(X, U) \mid X, T])
\end{gathered}
\end{split}\]
ただし、非線形関数を許容し、また条件付き処置効果CATEへの対応もしている
\(\tau=E[E[Y \mid X, T=1]-E[Y \mid X, T=0]]\) :条件付き因果効果
\(g(x)=P(T=1 \mid X=x)\) :(条件付き)傾向スコア
\(Q(t, x)=E[Y \mid T=t, X=x]\) :(条件付き)結果変数モデル
(参考) Imbens (2003)
\[\begin{split}
\begin{gathered}
U_i \stackrel{i i d}{\sim} \operatorname{Bern}(1 / 2) \\
T_i \mid X_i, U_i \stackrel{i n d}{\sim} \operatorname{Bern}\left(\operatorname{sig}\left(\gamma X_i+\alpha U_i\right)\right) \\
Y_i \mid X_i, T_i, U_i \stackrel{i n d}{\sim} \operatorname{Norm}\left(\tau T_i+\beta X_i+\delta U_i, \sigma^2\right)
\end{gathered}
\end{split}\]
実装#
著者自身がライブラリを作っていてpip installできるが、ドキュメントがなくてわかりづらい⋯