“The Nagasaki Shipping List and Advertiser”のトピック分析

今日、長崎大学の図書館で日本最初の英字新聞を電子化公開したというニュースが流れていたので、データを取得して、LDAでトピック分析してみました。データ量が多くなかったので、数時間の作業でした。D3.jsは今回初めて使いましたが、良い感じです。下のリンクをクリックすると、トピック分析の結果を可視化したものがご覧いただけます。”nagasaki”と”shanghai”が中央に並んで現れているのが象徴的です。

http://dmlab.jpn.org/example/bubble.html