Python3でMeCab

自分用(学生に指示するときのための)メモ。

MeCabをローカルにインストールする場合。
ipadicをconfigureするときに、ローカルにインストールしたmecab-configを–with-mecab-configで指定するのを忘れないように。たとえば

./configure --with-mecab-config=/home/masada/local/bin/mecab-config --with-charset=utf8 --prefix=/home/masada/local

など。そうしないと、システムにすでにインストールされてあったMeCabのほうのmecab-configを見に行って、make installするときに権限のないディレクトリに辞書をコピーしようとする。

Python3のprintで日本語を表示させたい場合。
やはりsys.stdoutのencodingを強制的にutf8に変えてしまうのがいいのではないかと。
すると、MeCabを使う最小限のコードは以下のような感じかな。