感度分析#

感度分析(sensitivity analysis)はモデルにさまざまなデータを入力し、推定した因果効果についての妥当性を評価する方法。

入力を変化させたときの出力の変化の「方向(正負)」と「度合い(強さ)」を測る。

手法#

Rosenbaum bound(Rosenbaum 2002)は結果変数が二値で、未観測の交絡因子が1次元かつ\([0, 1]\)の範囲の値をとる場合の感度分析

部分決定係数(Partial R2, Imbens 2003)は線形回帰モデルの欠落変数バイアスを測る。

Austen plot(Veitch & Zaveri, 2020)はPartial R2を非線形モデル(機械学習など)でも使えるように拡張したような手法

E-value(VanderWeele & Ding, 2017)はリスク比のように比率で効果を測るときの感度分析で、モデルに依存せず、「観測された関連性(処置群と対照群の結果のリスク比)がすべて交絡因子のせいだとしたら、その交絡因子はどれだけ強い関連性(リスク比)をもつのか」を評価するシンプルで使いやすい指標。

企業での利用例#

Uberの事例#

Uberの因果推論フレームワークCeViChEにおいて感度分析を行っている

主に

  • プラセボテスト

  • 関係のない交絡因子の追加・置換

  • サブセットデータを用いた検証

  • 選択バイアスの検証

を行って多角的に感度分析している

Spotifyでの事例#

Zeitler, J., Vlontzos, A., & Gilligan-Lee, C. M. (2023, August). Non-parametric identifiability and sensitivity analysis of synthetic control models. In Conference on Causal Learning and Reasoning (pp. 850-865). PMLR.

タイトルの通り、Synthetic Controlの感度分析

著者のうちのVlontzosはSpotifyの人

Booking.comでの事例#

KDD 2024 Workshop で出てきた発表

機械学習を利用した感度分析1:Veitch & Zaveri (2020)#

Veitch & Zaveri (2020)は機械学習を用いた感度分析を提案した

長所は

  1. 未観測の交絡因子が1つでも複数でも対応可能

  2. 非線形モデルにも対応可能

短所は

  1. 大体の傾向しか出せない

  2. サンプル数が小さいと精度が低い

実装

機械学習を利用した感度分析2:Chernozhukov, et al. (2022)#

Chernozhukov, et al. (2022)は部分線形モデル(DML)の感度分析を提案

DoWhy documentation が概要の解説と実装の両面で参考になる

Semiparametric#

Semiparametric sensitivity analysis: unmeasured confounding in observational studies | Biometrics | Oxford Academic