欠落変数バイアス

欠落変数バイアス#

線形回帰モデルに含めるべき説明変数を含めず、外生性の仮定が満たされない場合に生じるバイアスのことを 欠落変数バイアス（omitted variable bias） という。

背景#

外生性#

単回帰モデル\(Y = \alpha + \beta X + u\)を例にとる。

外生性

説明変数\(X\)と誤差項\(u\)が

\[ E(u | X) = 0 \]

を満たすとき、\(X\)は外生変数であるという。

また、\(X\)が外生変数であるならば、

\[ E(u) = 0, E(X, u) = 0 \]

と、説明変数\(X\)と誤差項\(u\)の無相関

\[ \operatorname{Cov}(X, u) = 0 \]

が成り立つ

OLS推定量の一致性#

単回帰モデル \(Y=\alpha+\beta X+u\) は両辺を\(X\)と共分散をとると

\[\begin{split} \begin{aligned} \operatorname{Cov}(X, Y) &= \operatorname{Cov}(X, \alpha + \beta X + u)\\ &= \underbrace{ \operatorname{Cov}(X, \alpha) }_{定数との共分散 → 0} + \beta \underbrace{ \operatorname{Cov}(X, X) }_{=\operatorname{Var}(X) } +\operatorname{Cov}(X, u) \\ &= \beta \operatorname{Var}(X) + \operatorname{Cov}(X, u)\\ \end{aligned} \end{split}\]

傾き係数のOLS推定量に代入すると

\[\begin{split} \begin{aligned} \hat{\beta} &= \frac{\operatorname{Cov}(X, Y)}{\operatorname{Var}(X)}\\ &= \frac{ \beta \operatorname{Var}(X) + \operatorname{Cov}(X, u) }{\operatorname{Var}(X)}\\ &= \beta + \frac{\operatorname{Cov}(X, u)}{\operatorname{Var}(X)} \end{aligned} \end{split}\]

という形に整理できる。

\(X\)が外生変数のとき、\(\operatorname{Cov}(X, u) = 0\)より

\[ \hat{\beta} = \beta + \frac{ \overbrace{\operatorname{Cov}(X, u)}^{=0} }{\operatorname{Var}(X)} = \beta \]

となり、OLS推定量\(\hat{\beta}\)と真のパラメータ\(\beta\)は一致する。