さくらインターネットに自前の辞書を設定する方法

スポンサーリンク

今後辞書にキーワードを追加とかやってみたいので、自前の辞書を見るようにします。

こちらを参考にしました。
さくらインターネットにPerl版のMeCab(形態素解析)を導入する

ちょっと読んでみたら、仕組みは単純みたいです。

デフォルトだと、

/usr/local/etc/mecabrc

を見に行くんですね。

でも、ホームディレクトリに

/home/****/.mecabrc

があると、こちらを優先的に見てくれます。

というわけで、コピーして書き込み権をつけます。

$ cd
$ cp -i /usr/local/etc/mecabrc .mecabrc
$ chmod u+w .mecabrc

viで編集します。
試しに、適当な存在しないディレクトリをdicdirに指定してみます。

;
; Configuration file of MeCab
;
; $Id: mecabrc.in,v 1.3 2006/05/29 15:36:08 taku-ku Exp $;
;
;dicdir =  /usr/local/lib/mecab/dic/ipadic
dicdir =  /usr/local/lib/mecab/dic/hoge
; userdic = /home/foo/bar/user.dic
; output-format-type = wakati
; input-buffer-size = 8192
; node-format = %m\n
; bos-format = %S\n
; eos-format = EOS\n

これで実行してみると・・・

~]$ mecab
param.cpp(69) [ifs] no such file or directory: /usr/local/lib/mecab/dic/hoge/dicrc

ちゃんと見に行く先が変わりました!

というわけで、インストールされた場所を指定してみます。

dicdir =  /home/****/local/home/****/local/lib/mecab/dic/naist-jdic

見比べてみます。

デフォルト辞書

めかぶの辞書のインストールが何故かうまくいかない。
め      名詞,一般,*,*,*,*,め,メ,メ
かぶ    動詞,自立,*,*,五段・ラ行,体言接続特殊2,かぶる,カブ,カブ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
辞書    名詞,一般,*,*,*,*,辞書,ジショ,ジショ
の      助詞,連体化,*,*,*,*,の,ノ,ノ
インストール    名詞,一般,*,*,*,*,インストール,インストール,インストール
が      助詞,格助詞,一般,*,*,*,が,ガ,ガ
何故か  副詞,一般,*,*,*,*,何故か,ナゼカ,ナゼカ
うまく  形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,うまい,ウマク,ウマク
いか    動詞,自立,*,*,五段・カ行促音便,未然形,いく,イカ,イカ
ない    助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ
。      記号,句点,*,*,*,*,。,。,。

新辞書

めかぶの辞書のインストールが何故かうまくいかない。
め      名詞,一般,*,*,*,*,め,メ,メ,,
かぶ    動詞,自立,*,*,五段・ラ行,体言接続特殊2,かぶる,カブ,カブ,かぶ/被,
の      助詞,連体化,*,*,*,*,の,ノ,ノ,,
辞書    名詞,一般,*,*,*,*,辞書,ジショ,ジショ,,
の      助詞,連体化,*,*,*,*,の,ノ,ノ,,
インストール    名詞,一般,*,*,*,*,インストール,インストール,インストール,,
が      助詞,格助詞,一般,*,*,*,が,ガ,ガ,,
何故    副詞,助詞類接続,*,*,*,*,何故,ナゼ,ナゼ,,
か      助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ,,
うまく  形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,うまい,ウマク,ウマク,うまく/上手く,
いか    動詞,自立,*,*,五段・カ行促音便,未然形,いく,イカ,イカ,いか/逝か,
ない    助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ,,
。      記号,句点,*,*,*,*,。,。,。,,

区切りは変わってないですけど、feature文字列?がちょっと変わっています。

スポンサーリンク







シェアする

  • このエントリーをはてなブックマークに追加

フォローする

スポンサーリンク