ADMA 2018に論文がショートペーパーとして受理されました
国際会議ADMA 2018に論文がショートペーパーとして受理されました。
http://adma2018.nuaa.edu.cn/
この論文は、潜在的ディリクレ配分法(LDA)の変分ベイズ推定で、変分近似事後分布にimplicitな分布を使うとどうなるか試してみました、という論文です。
テストデータで評価したperplexityは非常に良くなります。
ただし、トピック語(=各トピックの高確率語)が解釈しにくい、という問題があることも分かりました。LDAの原論文の変分推定やcollapsed Gibbs samplingによる推定を使って得られるトピック語は、経験上、解釈しやすいです。そのため、トピック語を直接見せるようなアプリケーションには、今回の提案手法は向いていません。
なぜ今回の推定で得られるトピック語は解釈しにくいのか?
・・・個人的には離散的な隠れ変数を周辺化するとこうなってしまうのではないか、と思っています。例えば、ProdLDA ( https://arxiv.org/abs/1703.01488 ) も離散的な隠れ変数を周辺化していますが、論文のTable 6で示されているProdLDAのトピック語は、他の手法のトピック語に比べて、解釈しにくいように見えます。この点については、今後さらに検証していこうと思っています。
[2018/09/29 追記] このADMA 2018という国際会議、投稿数が104、acceptance rateは23%だったそうです。