カテゴリー: いろいろ

Tiny Dataについて

tiny dataをキーワードに、うちの研究室の研究を方向付けることにしよう。そして、tiny dataは4つのDで特徴づけられる。distinctiveness, diversity, dynamism, debata

潜在的ディリクレ配分法(LDA)による国会会議録データセットのトピック分析

国会会議録データセットをlatent Dirichlet allocationで分析してみました。 http://dmlab.jpn.org/viz/gijiroku.html ・・・初めはストップワード的な単語を含むト

この研究室でどんなことを考えているか

この研究室で考えていることのひとつは、 「関係の多様性」です。 関係といっても、様々なものがありますが、 主に共起(cooccurrence)という関係を考えています。 同じ文書、同じ画像、等々、同じ場所で何かが一緒に現

SAGEによるMEDLINEデータセットの一部分の分析

http://dmlab2.sakura.ne.jp/example/bubble_medline12n06xx.html SAGEのための変分ベイズ推定を実装したので、MEDLINEデータセットのうちmedline12

Sparse additive generative modelsの式導出

もう1年前の論文ですが、EisensteinらのSparse additive generative modelsの論文にあった式の導出をしてみました。それほど複雑ではなかった感じです。 http://www.cis.n

研究メモ:ガウス分布の分散が指数分布に従うとして 分散を積分消去するとラプラス分布が得られることの証明

去年書いた研究メモです。 http://www.cis.nagasaki-u.ac.jp/~masada/2011062901.pdf

MATLABとPython(NumPy)とRの比較

MATLABとPython(NumPy)とRの比較だそうです。 http://mathesaurus.sourceforge.net/matlab-python-xref.pdf

“The Nagasaki Shipping List and Advertiser”のトピック分析

今日、長崎大学の図書館で日本最初の英字新聞を電子化公開したというニュースが流れていたので、データを取得して、LDAでトピック分析してみました。データ量が多くなかったので、数時間の作業でした。D3.jsは今回初めて使いまし

WordPress + Responsiv で研究室Webサイトを運営開始

正田です。 長崎大学で私の研究室 “Diversity Mining Laboratory” が活動を開始して もう半年近くになってしまうのですが、ようやく WordPress + Respons

タグ: ,
Top