Difference In Differences#

差の差法(difference in differences: DID)

2群・2期間のDID#

最もシンプルな2群・2期間のDIDを例にとる。

結果変数をY、処置変数をX{0,1}とする。 グループkの時点tYktとすると、推定したい効果βだけでなくグループごとの固定効果αkと時間ごとの効果δtも入ってくる。

Ykt=βXkt+αk+δt+εkt

グループk=1(処置群: X10=0,X11=1

  • 処置前(t=0):Y10=βX10+α1+δ0+ε10=α1+δ0+ε10

  • 処置後(t=1):Y11=βX11+α1+δ1+ε11=β+α1+δ1+ε11

グループk=0(対照群: X00=X01=0

  • 処置前(t=0):Y00=βX00+α0+δ0+ε00=α0+δ0+ε00

  • 処置後(t=1):Y01=βX01+α0+δ1+ε01=α0+δ1+ε01

個体固定効果αkを除去するため、グループごとに処置前後で差分をとると

Y11Y10=β+α1+δ1+ε11(α1+δ0+ε10)=β+α1α1+δ1δ0+ε11ε10=β+δ1δ0+ε11ε10Y01Y00=α0+δ1+ε01(α0+δ0+ε00)=α0α0+δ1δ0+ε01ε00=δ1δ0+ε01ε00

となり、時間固定効果δtを除去するために両者の差をとると

(Y11Y10)(Y01Y00)=β+δ1δ0+ε11ε10(δ1δ0+ε01ε00)=β+δ1δ0(δ1δ0)+ε11ε10(ε01ε00)=β+ε11ε10(ε01ε00)β

となる

2×2 DID#

2群2期間の最もシンプルなDIDを例に取る

処置群Tと対照群Uが存在し、処置前をPre、処置後をPostとする。DID推定量は各群の処置前後のYの平均の差

δ^TU2×2=(E[YT|Post]E[YT|Pre])(E[YU|Post]E[YU|Pre])

である。潜在的結果で表記すると次のようになる。

δ^TU2×2=(E[YT1|Post]E[YT0|Pre])(E[YU0|Post]E[YU0|Pre])

ゼロを加えて整理すると

δ^TU2×2=(E[YT1|Post]E[YT0|Pre])(E[YU0|Post]E[YU0|Pre])+E[YT0|Post]E[YT0|Post]0=E[YT1|Post]E[YT0|Post]ATT+[E[YT0|Post]E[YT0|Pre]][E[YU0|Post]E[YU0|Pre]]

となる。

時間固定効果がすべてのユニット(観測対象)で同じであり、期間の間で変化しないことを並行トレンド(parallel trends)の仮定と呼ぶ。並行トレンドの仮定が成り立てばDID推定量はATTを推定することになる。

なお、ここでE[YT0|Post]は実際には観測できない反実仮想であるため、並行トレンドの存在は検証不可能である。

TWFE推定量との関係#

二元配置固定効果(Two-Ways Fixed Effect: TWFE)モデル

Yit=αi+λt+δXit+ϵit
  • αi:個体固定効果

  • λt:時間固定効果

  • Xit:処置変数

TWFEモデルはDIDの推定に使われる

Baconの分解定理#

TWFE推定量は2×2DID推定量の加重和となる(なお重みはすべて正)

Note

定理(Theorem 1, Goodman-Bacon 2021) $$ \hat{\delta}^{TWFE} = \sum_{k\neq u} s_{ku} \hat{\delta}_{ku}^{2\times 2}

  • \sum_{k\neq u} \sum_{l > k} \left[ s_{kl}^k \hat{\delta}^{2\times 2, k}{kl} + s{kl}^l \hat{\delta}^{2\times 2, l}_{kl} \right] $$

標準誤差#

クラスタ数が少ない場合#

処置ユニット数が1つしかない、という極端なケースではクラスタ数が少ない場合に向けて提案されたワイルドブートストラップであっても、シミュレーション上では有意水準5%での過剰棄却率は80%となる( Cameron et al., 2008; MacKinnon & Webb, 2018)。

処置群のユニット数が1つしかないような極端なケースではランダム化推論(randomization inference)を使用することが好ましいとされる(Buchmueller et al., 2011)。

ランダム化推論#

TODO

並行トレンドの仮定の検証#

並行リード#

処置が行われる前の時点(リード lead)において並行なトレンドが存在していたことを確認する、という方法。

ある程度の確認はできるが、直接的に並行トレンドの存在を検証できるわけではない(例えばコインを2回投げて2回とも表が出たからと言って、3回目も表が出るとは限らない)

外生性#

並行トレンドの仮定が明らかに成立しない状況は、処置そのものが内生的である場合である。この場合は処置は潜在的結果に依存し、処置がもしなければ結果も平行じゃない変化をしていたと考えられる。

Multiple Timeperiod#

処置を行う時点が複数ある場合の対処について。

1. 生データを年ごとにプロットする方法#

デメリットは

  1. グラフが多すぎて、手間がかかり、見栄えが悪い

  2. 対照群が未処置群(never treated)だけの想定をする場合、誤る

    • Goodman-Bacon, 2021はどんなDIDもtreatment, never treated, early treated, late treatedの4種類があると示している

2. 処置の時点をt=0に再中心化する#

デメリットは

  1. 対照群をプロットできるものの、回帰分析で実際につかわれるものと一致しない(Goodman-Bacon, 2021)

処置の時点が複数あるものはStaggered DID(段階的DID)とも呼ばれる

小西祥文 (2021) Staggered DIDの近年の動向

Event study#

Synthetic Difference In Differences#

Clarke, D., Pailañir, D., Athey, S., & Imbens, G. (2023). Synthetic Difference In Differences Estimation. arXiv preprint arXiv:2301.11859.

matrix completion#

Athey et al. (2021). Matrix completion methods for causal panel data models. Journal of the American Statistical Association, 116(536), 1716-1730.

行列補完(matrix completion)という機械学習ベースの手法

論文#

Goodman-Bacon (2019)#

Goodman-Bacon (2019) “Difference-in-Differences with Variation in Treatment Timing”

Goodman-Bacon (2021) は 二元配置固定効果(two-way fixed effect)推定量が、すべてのあり得る2×2のDID推定量の重み付き平均であるという定理を示した。

例えば、DID推定量β^DDをtwo-way fixed effects modelとして表すと

yit=αi+αt+β^DDDit+uit

であり、これは処置が複数時点(ここでは2時点)にわたる場合は

β^DD=skUβ^kUDD+sUβ^UDD+[skβ^kDD+skβ^kDD]

という加重平均になる。ここで

  • β^kUDDは最初の処置群kと非処置群UのDiD推定量

  • β^UDDは二番目の処置群と非処置群UのDiD推定量

  • skβ^kDDkは処置される前後の期間(処置群)を使い、は処置前の期間を使う(対照群)場合のDiD推定量

  • skβ^kDDkは処置後のみの期間(対照群)では処置前後の期間(処置群)のDiD推定量

である

Athey & Imbens (2022)#

Athey, S., & Imbens, G. W. (2022). Design-based analysis in difference-in-differences settings with staggered adoption. Journal of Econometrics, 226(1), 62-79. [pdf]

処置のタイミングが複数ある場合であっても、割当がランダムなら標準的なDIDが特定の加重平均因果効果の不偏推定量となる

We show that under random assignment of the adoption date the standard Difference-In-Differences (DID) estimator is an unbiased estimator of a particular weighted average causal effect.

パッケージ#

R: {did}パッケージ#

Treatment Effects with Multiple Periods and Groups • did

以下に対応可能

  • 2時点以上の期間

  • 処置の時点が異なる

  • 並行トレンド仮定は共変量で条件づけたときのみ成立する

理論面の説明

参考文献#

サーベイ#

[2201.01194] What’s Trending in Difference-in-Differences? A Synthesis of the Recent Econometrics Literature

Canonical Assumption

理論的拡張(assumptionsの緩和)

Parallel Trend

共変量で条件づけたときだけParallel Trend

Single periods

Multiple periods and variation in treatment timing

DID on distribution#

https://twitter.com/KwekuOA/status/1676679605355151362

https://twitter.com/KwekuOA/status/1676681754952839169

https://twitter.com/KwekuOA/status/1667285957245038594

Differences-in-Differences on Distribution Functions for Program Evaluations

  • 拡張IPW推定を拡張

  • 各時点でのユニットの処置をIPWで補正

  • Wasserstein距離で処置前後の分布を比較