状態空間モデル#

系列から系列への変換器

State Space Models#

SSMsのうち、DeepSSMsの論文で見かける式

1次元のinput signal x(t) を N次元のlatent space h(t)にしたあとに1次元のoutput signal y(y)に射影する。

h(t)=Ah(t)+Bx(t)y(t)=Ch(t)+Dx(t)

ここでA,B,C,Dはパラメータであり勾配降下法で学習される。D=0とおいてy(t)=Ch(t)とするモデルもある。

ディープラーニングベースの状態空間モデル(Deep SSMs)#

[2404.09516] State Space Model for New-Generation Network Alternative to Transformers: A Survey

構造化状態空間モデル(S4)#

[2111.00396] Efficiently Modeling Long Sequences with Structured State Spaces

Structured State Space sequence model で S4と呼ばれる

S4は状態空間モデル(SSMs)をRNNとCNNの組み合わせとして扱う

S4の解説

Manbda(S6)#