Generalized Random Forest (GRF)#
[1610.01271] Generalized Random Forests
Generalized Random Forest(GRF) はRandom Forestを局所的な重み付けの推定器として一般化したもの。
与えられた観測点 \(x\) に対し、その周囲の観測データを「重み付き」平均で統計量を推定する構造
目的変数は一般のM-推定問題に拡張可能(平均だけでなく、分位点、最適政策など)
理論#
まずモーメント条件により\(\theta(x)\)のforest-based estimatorsを定義する
データ \((X_i, O_i) \in \mathcal{X} \times \mathcal{O}\) が次の式を満たすと仮定する
\(\theta=(\theta(x))_{x \in \mathcal{X}} \in \Theta=\left\{\theta: \mathcal{X} \rightarrow \mathbb{R}^{k_p}\right\}:\) 興味のある(汎関数)パラメータ
\(\nu=(\nu(x))_{x \in \mathcal{X}} \in \Theta=\left\{\nu: \mathcal{X} \rightarrow \mathbb{R}^{k_q}\right\}:\) 局外(汎関数)パラメータ
\(\psi_{., .}(\cdot): \mathcal{X} \times \mathcal{O} \rightarrow \mathbb{R}^{k_\psi}:\) スコア関数
一般化ランダムフォレストの理論と統計的因果推論への応用 - Speaker Deck
非常によくまとまっている資料
Random Forest / Tree は、サンプルをある基準で重み付けるカーネルを学習するもの、という一般化
grfパッケージ(R)
GRFは欠陥あり?#
Atlantic causal inference conferenceの因果推論コンペでの成績は悪かったらしい
(Ken McAlinnさんはTwitterを使っています: 「因果推定コンテストで回帰分析にボロ負けした話もちゃんと載せてほしい。」 / Twitter)