実験デザイン#

Randomized Experiments (without interference)#

\(N\)個のunitsの有限の母集団(finite population)を考える(たとえば伝統的な設定だと、個人や企業や国など)。

古典的なRCTでは、母集団の各ユニット\(i\)は2つの潜在的結果\(Y_i(C), Y_i(T)\)で特徴づけられる。 ここで\(Y_i(C)\)\(i\)が対照群のときの結果で\(Y_i(T)\)\(i\)が処置群のときの結果。

これらの潜在的結果はSTUVA条件のもとで、処置割当\(W_i \in \{C, T\}\)のみに依存する。

処置割当がランダムだとすると、平均因果効果\(\tau\)

\[ \tau = \frac{1}{N}\sum^N_{i=1} \big[ Y_i(T) - Y_i(C) \big] = \bar{Y}(T) - \bar{Y}(C) \]

ここで\(\bar{Y}(w) = \sum^N_{i=1} Y_i(w) / N\)\(w\in\{C, T\}\)

\(\tau\)は母集団の量であり、それぞれのユニットは処置群か対照群のいずれかに割り振られて両方を同時に観測することはできないため、\(\tau\)は直接は観測できない。

SUTVAの下で、strictly positiveな(\(> 0\)の)ユニット数の処置群と対照群を仮定した下で、処置グループごとの平均アウトカムの差が\(\tau\)の不偏推定量

\[ \hat{\tau} = \bar{Y}_T - \bar{T}_C \]

となる。ここで\(\bar{Y}_w = \sum^N_{i=1} 1\{W_i = w\} Y_i / N_w\)\(N_w\)は処置グループ\(w \in \{C, T\}\)のユニット数。

標準誤差#

\(\hat{\tau}\)の分散は

\[ \mathbb{V} = \frac{S^2_C}{N_C} + \frac{S^2_T}{N_T} - \frac{S^2_{CT}}{N} \]

となる。ここで

\[\begin{split} S_w^2=\frac{1}{N-1} \sum_{i=1}^N\left(Y_i(w)-\bar{Y}(w)\right)^2\\ S_{C T}^2=\frac{1}{N-1} \sum_{i=1}^N\left(Y_i(T)-Y_i(C)-\tau\right)^2 \end{split}\]

\(\hat{\tau}\)の分散の標準的な(しかし保守的な)推定量は

\[ \hat{\mathbb{V}} = \frac{s^2_C}{N_C} + \frac{s^2_T}{N_T} \]

となる。ここで

\[ s_w^2=\frac{1}{N_w-1} \sum_{i: W_i=w}^N\left( Y_i(w)-\bar{Y}_w \right)^2 \]

interference#

標準的なRCTはno-interferenceの仮定あるいはSUTVAを仮定する。

interference(干渉?)が存在する場合、あるユニットの処置割当\(w_i\)が他のユニットの処置割当の影響を受ける。

一般に、潜在的結果は\(N\)次元ベクトル\(\boldsymbol{w}=[w_1,\dots,w_N]^\top\)で決められるもの\(Y_i(\boldsymbol{w})\)とする。

観測できるのは1つの処置ベクトル\(\boldsymbol{w}\)のみであるため、interferenceの範囲に何の制約も課さないと分析を行うことが困難になる。 そのため潜在的結果に何らかの構造を課するあるいはモデルを仮定することで潜在的結果が割当ベクトルに完全に依存することを制限する。

interferenceの制約#

これまで考えられてきている制約は2種類のクラスに分けられる。

  1. ユニット\(i\)の潜在的結果\(Y_i\)\(\boldsymbol{w}\)の部分集合にのみ依存する

    • 母集団の一部のユニットに割り当てられた処置のみがユニット\(i\)の結果に影響を与える

    • Aronow & Samii(2017)が exposure mappings と呼ぶもの

    • Ogburn & VanderWeele(2014)が direct interference と呼ぶもの

    • 例:ランダムに選ばれた借り手に、借家が無料でキャンセルできる権利がオファーされる実験を考える。特定の街の借家が無料のキャンセル権とともに来ることが、同じ街の他の物件の賃貸に影響を与えるかもしれない。しかし他の街には影響を与えないと考えられる。

    • 例:教育の場合でも、interferenceが同じクラスや同じ学校の学生の範囲に制限され、その範囲を超えないと仮定するのは合理的な事が多い

  2. ユニット\(i\)の結果に影響を与える他のすべてのユニットへの処置の可能性を許容する

    • この設定のもとでは、interferenceは処置を通じてではなく結果を通じていくものと仮定される

    • 例:処置がワクチンとする。もし個人\(j\)が自身の処置に影響を受ける場合、個人\(i\)の結果は異なる個人\(j\)の処置に依存する。

      • 個人\(j\)の処置が個人\(j\)の感染状態に影響を与えない限り、個人\(i\)は個人\(j\)が処置を受けたかどうかは気にしない

    • Ogburn & VanderWeele(2014)が interference by contagion と呼ぶもの

    • このタイプのinterferenceは識別に追加の仮定を必要とする:例えばユニット\(i\)\(j\)の距離を測れば、その距離はスピルオーバー効果の大きさを無視できると仮定するのに合理的なものかもしれない

Cluster Interference#

典型的なタイプのinterferenceで、direct interference(潜在的結果の依存が割当ベクトルの部分集合に制約される)の代表。

この設定の下での重要な仮定は、ユニットの母集団が事前にクラスターに分割できるというもの。

  • この分割されたクラスターは、特定のクラスターのユニットの結果が同じクラスター内の他のユニットが受けた処置にのみ影響を受ける。

  • 言い換えれば、interferenceは各クラスター内なら制限がなく、異なるクラスタのユニット間にはinterferenceが起きないというもの。

この状況の例:

  • 教育:ある生徒の結果が同じクラスの別の生徒の処置の影響を受ける

  • 労働市場:職業訓練プログラムのような介入が存在し、特定の個人の結果が同じ労働市場の他の個人の訓練状況に影響を受ける

定式化:

ユニット\(i\)が属するクラスター(block)を\(B_i\in \{ 1, \dots, B \}\)と表す。

クラスターの干渉の仮定は、ユニット\(i\)と同じクラスターに属するすべてのユニット\(j\)について\(w_j = w_j'\)となるすべての\(\boldsymbol{w}\)\(\boldsymbol{w}'\)について

\[ Y_i(\boldsymbol{w}) = Y_i(\boldsymbol{w}') \]

Network Interference#

Bajari et al. (2023). Experimental design in marketplaces. Statistical Science, 1(1), 1-19.

Viviano et al. (2023). Causal clustering: design of cluster experiments under network interference. arXiv preprint arXiv:2310.14983.

Multiple Randomization Designs (MRDs)#

処置がpairs of populations(例えば買い手と売り手、ドライバーと乗客、貸し手と貸与物)に割り当てられる状況を扱う