潜在的ディリクレ配分法(LDA)による国会会議録データセットのトピック分析

国会会議録データセットをlatent Dirichlet allocationで分析してみました。
http://dmlab.jpn.org/viz/gijiroku.html

・・・初めはストップワード的な単語を含むトピックを取り除いてから可視化しようと思ったのですが、
ストップワード的な単語を含むトピックには、時代に特有な言葉遣いが現れていることもあると気づき、
100個すべてのトピックを視覚化してあります。