雑記帳(@watagasi_)

LDA全くわからない

LDAがこういったグラフィカルモデルで表現できるというのはだいたい理解できたんですけど。

f:id:watagassy:20171025162147p:plain

各変数が以下のような分布に従うって式があるじゃないですか。

f:id:watagassy:20171025162317p:plain

f:id:watagassy:20171025162326p:plain

でも例えばこのΘってディリクレ分布の確率変数ですよね。これをどうやって多項分布のパラメータとして扱うんですか…。その辺が全くわかってないです(つまり全て理解できていない)。

 

※追記1

理解しました。αを決めたらDir(Θ|α)がf(Θ)の形になって、Θを決めたらMulti(Zn|Θ)がf(Zn)の形になって…と順次パラメータを決定していくわけですね。

 

※追記2

yagays.github.io

このブログを見て殊更理解できました。こういうグラフィカルモデルがあって順次パラメータを決定していけばいいとわかってる時にパラメータを決める方法がEMアルゴリズムだとか崩壊ギブスサンプリングだとかなわけですね。

 

それらの使い分けはこちらのブログである程度紹介されていたものが分かりやすかったです。

qiita.com