6月 102012
 

Mecab ではシステム辞書とユーザー辞書に登録できる。

□単語の追加方法

フォーマットはこんな感じらしい。

表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音

1. 作業用&辞書保存用のディレクトリ作成

2. 辞書ファイル作成

vim 等のテキストエディタで下記のように辞書ファイルの元を作ります

みやみや,,,10,名詞,固有名詞,人名,*,,,みやみや,ミヤミヤ,ミヤミヤ

今回は userdic.csv として保存しました。 その後次のコマンドで辞書ファイル user.dic を作成します。

面倒なんで alias を作成しておいた。

3. 辞書ファイルを登録

vim 等のテキストエディタで下記のように辞書ファイルを登録します。

修正ファイル: /usr/local/etc/mecabrc

userdic = /home/アカウント名/mecab/user.dic

6月 042012
 

試すのは YahooAPI
の形態素解析で充分楽しめたのですが、実際に自分で辞書を作ってみたりとかやってみたかったので、Mecab
をインストールして試すことに。

Mecab と辞書ファイルのダウンロード

http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html

上記サイトの「ダウンロード」より、Mecab 本体と IPA 辞書をダウンロード。\
俺がダウンロードした時は mecab-0.993.tar.gz でした。

Mecab のインストール

辞書ファイルのインストール

実行してみる

なんかテンション上がるwww

6月 032012
 

今更ながら Twitter bot を作ってみようかなっと思ったことと、前に後輩が出向に行っていた形態素解析って使ってみたいなっと思ったので、まずは気軽に使えそうな Yahoo API の形態素解析を使ってみた。 ちなみに Yahoo ID 必須。

1. 下記のアドレスから「アプリケーションIDの登録(無料)」を選ぶ

□日本語形態素解析

2. 実際に試してみる

3. 結果を var_dump する

簡単に試せるのでいいね。