MeCabモジュールの調整と、辞書候補ファイルへの書き込み制御の追加

 今まで単語解析用のMeCabモジュールは、低頻度辞書を読み込んで論文無いように応じてそのまま更新するようにプログラムしていましたが、Wikipedia辞書とのマッチを調べるプログラムを作成したので、Wikipedia辞書とのマッチを調べてから低頻度辞書を更新するようにしたいので、MeCabモジュールで低頻度辞書を書き換える部分を、辞書登録候補ファイルへの書き込みになるように直しました。

foreach $m ( keys %low_history ) {
if ( $low_history{"$m"} > ( $min * 2 ) ) {
$weight =1; #辞書候補更新許可フラグ

foreach $n (@low_dic) {
if ( ( $m =~ /\Q$n/ ) ) { #辞典にヒットしたら追加しない
$weight =0;
delete($low_history{"$m"}); #辞書に存在するので削除
last;
}
}

if ($weight) {
print LD "$m\n"; #新たな単語の追加
$check =1; #新規後出現
delete($low_history{"$m"} ); #追加した単語を履歴から削除
}
}
}

 ファイルハンドラのLDは、追加モードでオープンした辞書登録候補ファイルになるようにしてあります。
 その後、作成したWikipedia辞書作成ファイルをサーバに置き、crontabを使って自動的に動くようにセットしておきました。毎日午前0時ジャストに動くはずです。ログを残すようにしたので、今度来たときに確認してみます。