CatBoost#
Prokhorenkova et al. (2018). CatBoost: unbiased boosting with categorical features
Prediction Shift#
CatBoost論文のprediction shiftについて完全に理解する - threecourse’s blog
各iterationで同じ訓練データを使うことの問題
1本目と2本目の木の作成で同じデータセットを使うことにより、予測値の期待値に\(1 / (n − 1)\) に比例する偏りが発生する。
prediction shiftの影響を受けないよう、CatBoostではデータ数が少ない場合にはordered boostingというアルゴリズムを使用するようになっている。