時系列データの変換#
定常過程への変換#
分析しやすいデータ:定常過程#
定常過程の場合、期待値や自己共分散が時間を通じて一定なので、例えば「1月の平均気温」は1月の各観測値の平均をとれば求められる。
ARIMAモデルは定常過程との相性がよいため、モデルを使った分析もしやすい。
最も基礎的な(弱)定常過程は、ホワイトノイズを用いて
\[
y_t=\mu+\varepsilon_t, \quad \varepsilon_t \sim \text { W.N. }\left(\sigma^2\right)
\]
としたもの(\(E(y_t) = \mu\))
Show code cell source
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
n = 100
np.random.seed(0)
mu = np.random.normal(size=n)
noise = np.random.normal(size=n)
y = mu + noise
fig, axes = plt.subplots(figsize=[8,2], ncols=2)
axes[0].plot(range(n), y)
axes[0].set(title="stationary process")
pd.plotting.autocorrelation_plot(y, ax=axes[1])
axes[1].set(title="autocorrelation")
[Text(0.5, 1.0, 'autocorrelation')]
単位根過程と和分過程#
非定常なデータのひとつである 単位根過程 は、差分をとることで定常過程になる。
\(d-1\)階差分をとっても非定常だが\(d\)階差分をとると定常になる系列は \(d\)次和分過程 と呼ばれ、\(I(d)\)と表す。