OLSの検定・区間推定

OLSの検定・区間推定#

OLS推定量の標準誤差#

ある推定量の漸近分布（asymptotic distribution、大標本において推定量が近似的に従う分布）の標準偏差を標準誤差（standard error）という。

重回帰モデル

y = β_{0} + β_{1} x_{1} + \dots + β_{d} x_{d} + ε

において、各 $k = 0, 1, \dots, d$ について、回帰係数 $β_{k}$ のOLS推定量 ${\hat{β}}_{k}$ は、中心極限定理により十分大きな $n$ のもとで

Z = \frac{\sqrt{n} ({\hat{β}}_{k} - β_{k})}{s}

が近似的に標準正規分布 $N (0, 1)$ に従う。

ここで $s$ は標本標準偏差に相当するもの。

上記の式は書き換えると

{\hat{β}}_{k} = β_{k} + \frac{s}{\sqrt{n}} \cdot Z

となる。ここで

σ = \frac{s}{\sqrt{n}}

とおけば、 ${\hat{β}}_{k}$ は平均 $β_{k}$ 、分散 $σ^{2}$ の正規分布 $N (β_{k}, σ^{2})$ に従うということになる。

別の定義では、残差を $\hat{u}$ とすると ${\hat{β}}_{1}$ の分散は

{\hat{σ}}_{{\hat{β}}_{1}}^{2} = \frac{1}{n} \frac{\frac{1}{n - 2} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} {\hat{u}}_{i}^{2}}{[\frac{1}{n} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}]^{2}}

で、 $S E ({\hat{β}}_{1}) = \sqrt{{\hat{σ}}_{{\hat{β}}_{1}}^{2}}$ となる

誤差項 $ε_{i}$ の分散 $σ^{2}$ が既知かつ均一分散のとき

V a r [\hat{β}] = \frac{σ^{2}}{\sum (X_{i} - \bar{X})^{2}}

分散が既知かつ不均一分散のとき

V a r [\hat{β}]_{h e t} = \frac{\sum (X_{i} - \bar{X})^{2} σ_{i}^{2}}{[\sum (X_{i} - \bar{X})^{2}]^{2}}

（『統計的因果推論の理論と実装』p.118）

b = 1
np.exp(b) - 1

1.718281828459045

model.summary()

OLS Regression Results
Dep. Variable:	y	R-squared:	0.675
Model:	OLS	Adj. R-squared:	0.674
Method:	Least Squares	F-statistic:	619.8
Date:	Fri, 04 Apr 2025	Prob (F-statistic):	9.04e-75
Time:	10:54:42	Log-Likelihood:	-422.93
No. Observations:	300	AIC:	849.9
Df Residuals:	298	BIC:	857.3
Df Model:	1
Covariance Type:	nonrobust

	coef	std err	t	P>\|t\|	[0.025	0.975]
Intercept	10.0882	0.117	86.551	0.000	9.859	10.318
x	4.9289	0.198	24.896	0.000	4.539	5.318

Omnibus:	1.176	Durbin-Watson:	2.115
Prob(Omnibus):	0.555	Jarque-Bera (JB):	1.153
Skew:	-0.033	Prob(JB):	0.562
Kurtosis:	2.703	Cond. No.	4.42

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

# CI
ci = (
    beta1 - 1.96 * se_beta1,
    beta1 + 1.96 * se_beta1
)

fig, ax = plt.subplots()
x_plot = np.linspace(4, 6, 50)
y_plot = norm.pdf(x=x_plot, loc=beta1, scale=se_beta1)
ax.plot(x_plot, y_plot, alpha=.5)
ax.axvline(ci[0])
ax.axvline(ci[1])

<matplotlib.lines.Line2D at 0x7f1a7b0202e0>

../../_images/b85f43e5fb694cb916c49c8d10ef47de749a2325afcb50c81add721e3ad45956.png

Note

データによる例

例えば次のように生成されたデータがあるとする。

\begin{array}{r} \begin{aligned} y & = 10 + 5 x + e \\ x & \sim Uniform (0, 1) \\ e & \sim N (0, 1) \end{aligned} \end{array}

シミュレーションによって（データを生成して推定することを繰り返すことによって）この分布を見てみる

../../_images/6538f9f2c103f99da0b527650370bdcee47dde32613225185cb8cb5914917fc2.png

OLS推定量の $t$ 検定#

帰無仮説と対立仮説をそれぞれ

\begin{array}{r} H_{0} : β_{k} = 0 \\ H_{1} : β_{k} \neq 0 \end{array}

とする。 $t$ 統計量を

t = \frac{{\hat{β}}_{k}}{σ} = \frac{\sqrt{n}}{\sqrt{s}} {\hat{β}}_{k}

と定義すると、これは標準正規分布 $N (0, 1)$ に従う。 $| t | > 1.96$ となればその確率は5%以下であるため有意水準5%で帰無仮説を棄却できる。

$t$ 検定の $p$ 値#

帰無仮説 $H_{0} : β_{k} = 0$ を棄却するためには有意水準をどこまで引き上げなければいけないかを考える。

$N (0, 1)$ に従う $Z$ を用いて、 $P (| Z | > | t |)$ を計算する

OLS推定量の信頼区間#

${\hat{β}}_{k}$ の漸近分布が $N (β_{k}, σ_{k}^{2})$ に従うとする。 $n$ が十分に大きいときは、

Z_{k} = \frac{{\hat{β}}_{k} - β_{k}}{σ_{k}}

は $N (0, 1)$ に従うものとみなすことができて、

P (| Z_{k} | \leq 1.96) = P (- 1.96 \leq \frac{{\hat{β}}_{k} - β_{k}}{σ_{k}} \leq 1.96) = 0.95

と近似できる。そこから95%信頼区間は

{\hat{β}}_{k} - 1.96 σ_{k} \leq β_{k} \leq {\hat{β}}_{k} + 1.96 σ_{k}

となる

回帰の標準誤差#

回帰の標準誤差（standard error of the regression: SER）は、回帰誤差 $ε$ の標準偏差の推定量

S E R = s_{\hat{u}}, s_{\hat{u}} = \frac{1}{n - d - 1} \sum_{i = 1}^{n} {\hat{u}}_{i}^{2}

（ $\hat{u}$ の平均はゼロであるため、通常の分散の式における平均で引くような項が存在していない）

ここで $d$ は推定している傾きのパラメータ数（定数項も含めれば $d + 1$ ）。下方バイアスが生じることがわかっているので自由度のぶんだけ修正する。