Tiny Dataについて
tiny dataをキーワードに、うちの研究室の研究を方向付けることにしよう。そして、tiny dataは4つのDで特徴づけられる。distinctiveness, diversity, dynamism, debatability.
— Tomonari MASADA (@tmasada) July 17, 2013
distinctivenessは、tiny data自身に意味があること。diversityは、tiny dataがそこから抽出されてきたところのbig dataの多様性をカバーしていること。前者はprecisionに、後者はrecallに、それぞれだいたい対応する。
— Tomonari MASADA (@tmasada) July 17, 2013
dynamismは、tiny dataがそこから抽出されたところのbig dataを離れても使えること。別のbig dataの理解にも使えること。このdynamismは、動的なことという意味でなく、潜在性をもつという意味。潜在的には他のデータの理解に使えるものである、という意味。
— Tomonari MASADA (@tmasada) July 17, 2013
debatabilityは、もしbig dataについてveracityが問題になるのであれば、tiny dataはbig dataのveracityを判断する手がかりになるものでないといけない、ということ。これについては、もうちょっと良い単語があるかもしれない。
— Tomonari MASADA (@tmasada) July 17, 2013
一言でいえば、tiny dataは基底みたいなもの、ということ。・・・これでしばらく研究室の研究の方向付けをしてみたい。
— Tomonari MASADA (@tmasada) July 17, 2013