カテゴリー: いろいろ

tiny dataをキーワードに、うちの研究室の研究を方向付けることにしよう。そして、tiny dataは4つのDで特徴づけられる。distinctiveness, diversity, dynamism, debata …

Tiny Dataについて Read More »

国会会議録データセットをlatent Dirichlet allocationで分析してみました。 http://dmlab.jpn.org/viz/gijiroku.html ・・・初めはストップワード的な単語を含むト …

潜在的ディリクレ配分法(LDA)による国会会議録データセットのトピック分析 Read More »

この研究室で考えていることのひとつは、 「関係の多様性」です。 関係といっても、様々なものがありますが、 主に共起(cooccurrence)という関係を考えています。 同じ文書、同じ画像、等々、同じ場所で何かが一緒に現 …

この研究室でどんなことを考えているか Read More »

http://dmlab2.sakura.ne.jp/example/bubble_medline12n06xx.html SAGEのための変分ベイズ推定を実装したので、MEDLINEデータセットのうちmedline12 …

SAGEによるMEDLINEデータセットの一部分の分析 Read More »

もう1年前の論文ですが、EisensteinらのSparse additive generative modelsの論文にあった式の導出をしてみました。それほど複雑ではなかった感じです。 http://www.cis.n …

Sparse additive generative modelsの式導出 Read More »

去年書いた研究メモです。 http://www.cis.nagasaki-u.ac.jp/~masada/2011062901.pdf

MATLABとPython(NumPy)とRの比較だそうです。 http://mathesaurus.sourceforge.net/matlab-python-xref.pdf

今日、長崎大学の図書館で日本最初の英字新聞を電子化公開したというニュースが流れていたので、データを取得して、LDAでトピック分析してみました。データ量が多くなかったので、数時間の作業でした。D3.jsは今回初めて使いまし …

“The Nagasaki Shipping List and Advertiser”のトピック分析 Read More »

正田です。 長崎大学で私の研究室 “Diversity Mining Laboratory” が活動を開始して もう半年近くになってしまうのですが、ようやく WordPress + Respons …

WordPress + Responsiv で研究室Webサイトを運営開始 Read More »

タグ: ,