時系列データの変換#

定常過程への変換#

分析しやすいデータ:定常過程#

定常過程の場合、期待値や自己共分散が時間を通じて一定なので、例えば「1月の平均気温」は1月の各観測値の平均をとれば求められる。

ARIMAモデルは定常過程との相性がよいため、モデルを使った分析もしやすい。

最も基礎的な(弱)定常過程は、ホワイトノイズを用いて

yt=μ+εt,εt W.N. (σ2)

としたもの(E(yt)=μ

Hide code cell source
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

n = 100
np.random.seed(0)
mu = np.random.normal(size=n)
noise = np.random.normal(size=n)
y = mu + noise


fig, axes = plt.subplots(figsize=[8,2], ncols=2)
axes[0].plot(range(n), y)
axes[0].set(title="stationary process")

pd.plotting.autocorrelation_plot(y, ax=axes[1])
axes[1].set(title="autocorrelation")
[Text(0.5, 1.0, 'autocorrelation')]
../../_images/f1f13c9d486ae0d47e2991e270cacdbc9d5e8a258e9d7d1e5629b96ebc0815df.png

単位根過程と和分過程#

非定常なデータのひとつである 単位根過程 は、差分をとることで定常過程になる。

d1階差分をとっても非定常だがd階差分をとると定常になる系列は d次和分過程 と呼ばれ、I(d)と表す。