2012-02-01から1ヶ月間の記事一覧

低頻度辞書の更新確認&シェルスクリプトでの変数取得テスト

前回crontabにWikipedia辞書から低頻度辞書の更新部分を追加しておいたので、それが上手く機能しているかどうか確認してみました。まず両辞書の更新時間がcronに設定した時間と同じだったので、正しく起動して更新が行われていたことは確認できました。 その…

生物用語ハイライトの調整&公開Webページ改良

MeCabモジュールで作成した頻度ファイルを、そのままColorKeywordsモジュールに渡すと、先に短い単語がhtml内でヒットしてハイライトタグが挿入されてしまい、その後その単語を含むもっと長い単語がhtml内でヒットしなくなってしまうという現象がありました…

サーバへの導入完了。

昨日から調べていたのですが、CPANからのダウンロードはできていたのですがmake testで引っかかっていたらしく、正常にインストールが完了していなかったようです。なので、CPAN> force install Net::Twitterとして強引にインストールを実行したところ、とり…

FABSボットの編集&サーバへライブラリ導入

PerlでNet::Twitterを用いたTwitter botの作成の続きで、前回文字化けしてしまったのは、文字コードのutf8フラグが外れていなかった為と分かりました。 $twit->update({ status => decode('utf8', $reply), in_reply_to_status_id => $statusId});として送信…

cron調整&FABSボットの開発

前回仕掛けておいたcronですが、今回見てみると上手く動いていなかったようで、どうやらcrontabの書式に誤りがあったようですorz 正しく書き直して毎朝10時に起動するように設定したら、今日の10時に上手く動いていたことが確認できました。 そして、前回調…

コードにちょっと細工&cronの仕掛け直し

前回までのMeCabモジュールでは、より短い単語が重みづけで上位になってしまうことが分かったので、もともと1000点を超えているような単語は、それ以上点数を上げないようにすることを試してみようと考えました。 foreach $m ( keys %freq ) { #単語1が if (…

MeCabモジュールの調整と、辞書候補ファイルへの書き込み制御の追加

今まで単語解析用のMeCabモジュールは、低頻度辞書を読み込んで論文無いように応じてそのまま更新するようにプログラムしていましたが、Wikipedia辞書とのマッチを調べるプログラムを作成したので、Wikipedia辞書とのマッチを調べてから低頻度辞書を更新する…