2011-09-01から1ヶ月間の記事一覧

HTML作り2回目&モジュール調整

今週にかけていろいろHTMLをいじって、FirstAuthorsのページをきちんと参照して、自動的に更新されるページにしました。まずFirstAuthorsの特定のページを見に行って、そのタイトルと公開日を取得して表示できるようにしました。また、FirstAuthorsの次のペ…

HTMLとCSS作り

プログラムを動かす手助けをするサイトの見栄えを改変すべく、テンプレートとなるHTMLのページと、そのページの整形をするCSSを作成しました。とりあえず生物系のページを参考にしつつ、自分にも作れそうな単純な感じのものをデザインしました。 その後デザ…

モジュールの調整&今後の方針

最近の論文に対してプログラムを実行して、MeCabでは上手く認識されない生物用語を辞書に登録し、またサ変接続関係の単語の処理部分を変更したりしました。これにより、上位にランクインする単語の精度が上がってきたので、今の切断ラインである45%ラインを…

Webページ改編3回目、そしてCGIへ…

FirstAuthorsのホームからの本文抽出は、いろいろ試しましたが、結局Javascriptだと、プログラムの動作がブラウザ頼みになってしまうため、環境に依存するのもどうかと思ったので、index.htmlをテンプレートとして、FirstAuthorsのページをパースする部分を…

Webページ改編2回目

今回は、一番始めに表示されるindexページに、cssファイルを適応させるところまで作成しました。 link relからファイルを指定し、cssファイルにはwidthやらmarginやらを書き込んで、とりあえず見た目ができたところです。まだ中身がないので、ほとんど意味が…

表示するWebページのHTML作成開始

プログラムの実行をより簡単にし、さらにその表示をもっと視覚に訴えられるように、Webページの作成を始めました。まずindex.htmlを作成して、簡単な情報を表示できるようになりました。 HTMLの作成はあまりお気に入りのツールがなかったので、とりあえずEcl…

Wikipedia取得の続き&MeCabモジュール組換え

前回Wikipediaのページを取得後にColorKeywordsが正規表現マッチに失敗していたのは、どうやら"("などの正規表現の特殊文字が含まれていたかららしく、これを無視するように設定したら問題なくマーカーを引くことができました。 Wikipediaでは、出典を表す"[…