【メモ】MeCabでデフォルトの辞書を変更する/RMeCabでUniDicを使う
以下は自分用のメモ書きです。Rコンソール上でMeCabを動かすことのできるRMeCabを動かすときの辞書の指定には、.dicファイルしか使うことができないため、デフォルの辞書を変更したときの記録です。
初心者向けです。
①Terminalを起動する。
②以下のように入力する。パスワードを求められたら入力する。
sudo vi /usr/local/etc/mecabrc
③テキストエディタが起動すると以下ように表示されるので、赤字にした行のipadicをunidicに直す。編集できない場合はESCを入力するとできる。
※なお、カーソルキーで場所を移動できる。
;
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
;
dicdir = /usr/local/lib/mecab/dic/ipddic
; userdic = /home/foo/bar/user.dic
; output-format-type = wakati
; input-buffer-size = 8192
④ESCキーでコマンドモードに戻る(?)ので、戻ったら「:」と「w」を同時に押す。
MeCab MeCab MeCab MeCab 名詞-普通名詞-一般
と ト ト と 助詞-格助詞
入力 ニューリョク ニュウリョク 入力 名詞-普通名詞-サ変可能
し シ スル 為る 動詞-非自立可能 サ行変格 連用形-一般
形態 ケータイ ケイタイ 形態 名詞-普通名詞-一般
素 ソ ソ 素 接尾辞-名詞的-一般
を オ ヲ を 助詞-格助詞
再度 サイド サイド 再度 名詞-普通名詞-副詞可能
試す タメス タメス 試す 動詞-一般 五段-サ行 終止形-一般
。 。 補助記号-句点
EOS
無事UniDicで解析できたようです。
※ただ、UniDicをRMeCabで使う場合種々の問題がありそう。
IPAでやらない場合は、MeCab単体で形態素解析をして、その結果をRでいじるのが無難か。
これほしい。