Conformal Regression

Contents

Conformal Regression#

Conformal Prediction (CP) は予測区間（prediction intervals）を算出するためのフレームワーク。

予測の残差から予測の幅を算出する。

DMLのcross-fittingのように、train setでは残差の予測モデルをfitせず、分けておいたcalibration setで残差の学習を行う。

前提#

問題設定#

$n$ 個の訓練サンプル ${(X_{i}, Y_{i})}_{i = 1}^{n}$ があるとし、予測対象のサンプル $(X_{n + 1}, Y_{n + 1})$ もあるとする。両方のデータ ${(X_{i}, Y_{i})}_{i = 1}^{n + 1}$ は 交換可能（exchangeable） であると仮定する（例えばi.i.d.であるとする）。

$Y_{n + 1}$ が含まれると思われる marginal distribution-free prediction interval $C (X_{n + 1} \subseteq R$ を構築したい。

exchangeability#

サンプル $(X_{i}, Y_{i})$ が任意の同時分布 $P_{X Y}$ から得られたものであり、サンプルの順列を変えても変わらないこと。i.i.d.よりは弱い仮定。

例えばサンプルが3つあるとして、 $(X_{1}, Y_{1}), (X_{2}, Y_{2}), (X_{3}, Y_{3})$ と $(X_{2}, Y_{2}), (X_{1}, Y_{1}), (X_{3}, Y_{3})$ は同じ同時分布を持つということ（Exchangeable random variables - Wikipedia）。

Conformal Regression#

まず、訓練データを2つに分割する

training set: ${(X_{i}, Y_{i}) : i \in I_{1}}$
calibration set: ${(X_{i}, Y_{i}) : i \in I_{2}}$

任意の回帰アルゴリズム $A$ を用いて、回帰モデルを訓練する

\hat{μ} (x) := A ({(X_{i}, Y_{i}) : i \in I_{1}})

calibration setで残差の絶対値を計算する

R_{i} = | Y_{i} - \hat{μ} (X_{i}) |, i \in I_{2}

所与の水準 $α$ のもとで、絶対残差の経験分布の分位点を計算する

Q_{1 - α} (R, I_{2}) := (1 - α) (1 + 1 / | I_{2} |) -th empirical quantile of {R_{i} : i \in I_{2}}

新しく与えられた点 $X_{n + 1}$ での予測区間は

C (X_{n + 1}) = [\hat{μ} (X_{n + 1}) - Q_{1 - α} (R, I_{2}), \hat{μ} (X_{n + 1}) + Q_{1 - α} (R, I_{2})]

/usr/local/lib/python3.10/site-packages/sklearn/utils/validation.py:2739: UserWarning: X does not have valid feature names, but LGBMRegressor was fitted with feature names
  warnings.warn(
/usr/local/lib/python3.10/site-packages/sklearn/utils/validation.py:2739: UserWarning: X does not have valid feature names, but LGBMRegressor was fitted with feature names
  warnings.warn(

../../_images/225a136461fd8320e3037f128eef7bc6719f60caa9a5ecd5cebd607163d0c1e3.png

Adaptive Conformal Prediction#

区間の幅を可変にしたものの総称？

Conformalized quantile regression#

locally adaptive

Romano et al. (2019). Conformalized quantile regression.

Seedat et al. (2023, April). Improving adaptive conformal prediction using self-supervised learning.

参考#