2011-09-01から1ヶ月間の記事一覧
今週にかけていろいろHTMLをいじって、FirstAuthorsのページをきちんと参照して、自動的に更新されるページにしました。まずFirstAuthorsの特定のページを見に行って、そのタイトルと公開日を取得して表示できるようにしました。また、FirstAuthorsの次のペ…
プログラムを動かす手助けをするサイトの見栄えを改変すべく、テンプレートとなるHTMLのページと、そのページの整形をするCSSを作成しました。とりあえず生物系のページを参考にしつつ、自分にも作れそうな単純な感じのものをデザインしました。 その後デザ…
最近の論文に対してプログラムを実行して、MeCabでは上手く認識されない生物用語を辞書に登録し、またサ変接続関係の単語の処理部分を変更したりしました。これにより、上位にランクインする単語の精度が上がってきたので、今の切断ラインである45%ラインを…
FirstAuthorsのホームからの本文抽出は、いろいろ試しましたが、結局Javascriptだと、プログラムの動作がブラウザ頼みになってしまうため、環境に依存するのもどうかと思ったので、index.htmlをテンプレートとして、FirstAuthorsのページをパースする部分を…
今回は、一番始めに表示されるindexページに、cssファイルを適応させるところまで作成しました。 link relからファイルを指定し、cssファイルにはwidthやらmarginやらを書き込んで、とりあえず見た目ができたところです。まだ中身がないので、ほとんど意味が…
プログラムの実行をより簡単にし、さらにその表示をもっと視覚に訴えられるように、Webページの作成を始めました。まずindex.htmlを作成して、簡単な情報を表示できるようになりました。 HTMLの作成はあまりお気に入りのツールがなかったので、とりあえずEcl…
前回Wikipediaのページを取得後にColorKeywordsが正規表現マッチに失敗していたのは、どうやら"("などの正規表現の特殊文字が含まれていたかららしく、これを無視するように設定したら問題なくマーカーを引くことができました。 Wikipediaでは、出典を表す"[…