モジュールの調整&今後の方針

 最近の論文に対してプログラムを実行して、MeCabでは上手く認識されない生物用語を辞書に登録し、またサ変接続関係の単語の処理部分を変更したりしました。これにより、上位にランクインする単語の精度が上がってきたので、今の切断ラインである45%ラインをを少し緩めてもいいかなーと思い始めましたが、もう少し様子を見て考えたいと思います。
 さて、プログラムの作成も佳境に入りましたが、今後の方針について考えてみました。gackelさんが生物用語をもとに論文間の関係データベースを作成しているらしいので、こちらのプログラムでも、論文を読み込んで得た単語リストを簡単に一覧できるようにし、さらにそのデータをプログラム間で共有できるようにしようと思いました。
 公開しているサイトでリンクをクリックすると、その論文における単語リストを閲覧・ダウンロードできるように、HTMLとCGIを組み合わせていこうと考えています。まずはそのためのスタイルシート作りですが、デザインが苦手な私にはちょっと苦労が多そうです。いろいろ参考にして作成していこうと思います。