mecab-pythonのインストール方法

MeCab 用の各種スクリプト言語 (perl, ruby, python, Java) のバインディングがあったので、ためしに python-mecab をインストールしてみた。

事前準備

Python モジュールをビルドするので python-dev パッケージが必要。

sudo aptitude install python-dev

ダウンロード

wget http://mecab.googlecode.com/files/mecab-python-0.993.tar.gz

インストール

まずは MeCab をインストール。

mecab-python のインストール

$ tar zxvf mecab-python-0.993.tar.gz
$ cd mecab-python-0.993
$ python setup.py build
$ sudo python setup.py install

実行例

まず、MeCab::Tagger というクラスのインスタンスを生成し, parse (もしくは parseToString) というメソッドを呼ぶことで, 解析結果が文字列として取得できる。MeCab::Tagger のコンストラクタの引数も、基本的に文字列として与える。

本家のサイトの例に沿ってためしてみた。

$ python
>>> import sys
>>> import MeCab
>>> m = MeCab.Tagger("-Ochasen")
>>> print m.parse("今日もしないとね")
今日	キョウ	今日	名詞-副詞可能		
も	モ	も	助詞-係助詞		
し	シ	する	動詞-自立	サ変・スル	未然形
ない	ナイ	ない	助動詞	特殊・ナイ	基本形
と	ト	と	助詞-接続助詞		
ね	ネ	ね	助詞-終助詞		
EOS

>>> m = MeCab.Tagger("-Owakati")
>>> print m.parse("今日もしないとね")
今日 も し ない と ね 

>>> m = MeCab.Tagger("-Oyomi")
>>> print m.parse("今日もしないとね")
キョウモシナイトネ

いい感じ。