状態空間モデル#

系列から系列への変換器

State Space Models#

SSMsのうち、DeepSSMsの論文で見かける式

1次元のinput signal \(x(t)\) を N次元のlatent space \(h(t)\)にしたあとに1次元のoutput signal \(y(y)\)に射影する。

\[\begin{split} h'(t) = A h(t) + B x(t)\\ y(t) =C h(t) + D x(t) \end{split}\]

ここで\(A,B,C,D\)はパラメータであり勾配降下法で学習される。\(D=0\)とおいて\(y(t) =C h(t)\)とするモデルもある。

ディープラーニングベースの状態空間モデル(Deep SSMs)#

[2404.09516] State Space Model for New-Generation Network Alternative to Transformers: A Survey

構造化状態空間モデル(S4)#

[2111.00396] Efficiently Modeling Long Sequences with Structured State Spaces

Structured State Space sequence model で S4と呼ばれる

S4は状態空間モデル(SSMs)をRNNとCNNの組み合わせとして扱う

状態空間モデルNN①Efficiently Modeling Long Sequences with Structured State Spaces - YouTube

Manbda(S6)#