モデルの評価

モデルの評価#

Double ML#

処置効果θ(X)の推定を行う。Yはoutcome, Tはtreatment

Y=θ(X)T+g(X)+ε,E[εX]=0T=f(X)+η,E[ηX]=0E[ηεX]=0

g(X),f(X)はそれぞれoutcomeとtreatmentを予測するモデル

別途outcomeをXから予測するモデルq(X)を構築し、残差

Y~=Yq(X)T~=Tf(X)

を得る。

これらを組み合わせて

Y~=θ(X)T~+ε

と回帰することでθ(X)を推定する。

rscore#

モデル評価のためのスコア。

r=1rlossbloss

ここで

rloss=E[(Y~τ(x)T~)2]

blossはconstant treatment model (linear double machine learning modelなど)のbaseline loss

Sensitivity analysis#

感度分析(sensitivity analysis)はモデルへのinputを少し変えることでモデルの反応がどれだけ変わるかを見るもの。

Refutation#

refutation法はDoWhyの論文で提案された方法。

  • データの部分集合DsubsetでATEの推定値がどれだけ変化するか

  • 共通原因(common cause)の変数を追加したモデルのATE推定値がもとのモデルからどれだけ変化するか

  • treatmentを並べ替え(permuting)たもの(placebo treatment)を入れてATE推定値がゼロになるか

など