CausalImpact#
CausalImpact は BSTS(ベイズ構造時系列モデル)で予測した「架空の対照群」と「処置群(実測値)」とを比較することで平均処置効果を推定する手法。
Bayesian Structural Time Series (BSTS)#
Scott & Varian (2014) Predicting the present with Bayesian structural time series.
統計学者Steven Scottと経済学者Hal Varianが提案したnowcastingモデル(直近の予測や現時点の欠測値を予測することもできる)
構造時系列モデル(状態空間モデル)#
観測方程式:\(y_t = Z_t^{\mathrm{T}} \alpha_t+\varepsilon_t, \quad \varepsilon_t \sim \mathcal{N}\left(0, \sigma_t^2\right)\)
状態方程式:\(\alpha_{t+1} = T_t \alpha_t+R_t \eta_t, \quad \eta_t \sim \mathcal{N}\left(0, Q_t\right)\)
状態の構成要素#
局所線形トレンド(local linear trend)#
\(\mu_t\):水準
\(\delta_t\):傾き
季節成分(Seasonality)#
\(S\)は季節数(例:\(S=7\)なら曜日効果)
総和がゼロになるように構成
回帰成分(Regression Component)#
静的または動的係数による回帰
静的:\(\beta_t = \beta\)
動的:\(\beta_{t+1} = \beta_t + \eta_{\beta,t}\)
spike and slab 事前分布#
多次元の説明変数に対応するためモデルの変数選択
ここで \(\rho = (\rho_1, \dots, \rho_J)^\top\) は各変数が選ばれるかどうかのベクトル
\(\rho_j = 1\):変数\(j\)が選ばれる(\(\beta_j \neq 0\))
\(\rho_j = 0\):除外される
パラメータの推論#
MCMC(Gibbsサンプリング)で状態\(\alpha\)とパラメータ\(\theta\)を交互更新。
Causal Impact#
時系列データを元に平均処置効果を推定する方法。
処置前の結果変数 \(Y\) の時系列をベイズ構造時系列モデル(BSTS)で学習し、処置後の時点における反実仮想の対照群の値 \(y_t^{(ct)}\) をBSTSで予測し、実測の処置後の値 \(y_t^{(obs)}\) との差分から処置効果を推定する。
論文:Inferring causal impact using Bayesian structural time-series models
Rパッケージ:CausalImpact
一般向け記事:効果測定に潜むバイアスを避けるには? 広告を正しく評価するための 4 条件 - Think with Google
効果の推定#
BSTSで反実仮想の事後予測分布から介入効果を予測する
時点ごとの効果(pointwise impact):
累積効果:
移動平均効果(running average effect):
どのくらいの精度で推定できるのか?#
動的線形回帰で人工データを作り、どれくらい有意に検出できるかを実験した
\(\beta_t\) はランダムウォーク:\(\beta_{t+1} \sim N(\beta_t, 0.01^2)\)
\(\mu_t\) はローカルレベル:\(\mu_{t+1} \sim N(\mu_t, 0.1^2)\)
評価結果
効果が1%未満の場合、検出力は低い。
効果が10%でも有意になる比率は30%ほど
効果が25%以上であれば80%以上で検出。
95%信頼区間の被覆率も理論値に近い。
CausalImpactがうまくいくデータ、うまくいかないデータ#
Evaluating the power of the causal impact method in observational studies of HCV treatment as prevention - PMC は人工データでのシミュレーションにより、どういったデータセットだとCausalImpact Method(CIM)がうまくいかなくなるのかを検証
時系列長:介入前および介入後の観測数が増えるほど、CIMの検出力が上がる。逆に観測が少ないと検出力は低下。
変動性:目的変数の変動が大きい(ノイズが多い)と、効果を検出しにくい。
相関度:処置群と対照群の目的変数が高い相関を持つほど、CIMが介入効果を識別しやすい。
計測誤差:目的変数、特に対照系列に含まれる誤差があると、推定された介入効果にバイアス(過大または過小)を引き起こし、検出力を大きく低下させた。
拡張版(誤差を考慮):計測誤差をモデルに取り込むことで、性能低下の一部を回復できることが示された。
全体として、「大規模データ・対照群多数・低ノイズ・高相関」という理想的条件下では CIM は良好に機能するが、これらの条件を満たさないと性能が保証されない。