EMアルゴリズム

EMアルゴリズム、パラメーターの推定に使われたり

yagays.github.io

 

混合ガウス分布の決定に使われたりしていますが

www.slideshare.net

どっちもやってることは同じで、尤度関数を最大化する値を探しているわけですよね。

 

で、今ユーザーのレビュー集合をLDA(のようなもの)に突っ込んで、ユーザーごとにパラメータの推論を行うトピックモデルの論文を読んでいて、ユーザーごとではなく似通ったユーザー集合ごとに推論が出来ないかというのを考えていて。

 

似通ったユーザーごとの確率分布を統合した混合分布をEMアルゴリズムを用いて作成することでそれが実現できないかと考えているんですが、どうやって似通っていると判断するのかとか、そもそもこの考え方が正しいのかとか完全にわからなくなっています。どうしましょう。