Latent Dirichlet Allocation (LDA)

Latent Dirichlet Allocation (LDA)#

テキストデータからトピック(話題)を抽出するモデルを トピックモデル(Topic Modeling) という。

LDA (Latent Dirichlet Allocation: 潜在的ディリクレ配分法) は代表的なトピックモデルのひとつ。「トピックモデル=LDA」のような扱われ方をされるくらい。

ディリクレ分布#

実装#

models.ldamodel – Latent Dirichlet Allocation — gensim

応用研究#

参考#

佐藤一誠. (2015). トピックモデルによる統計的潜在意味解析.