2012-06-01から1ヶ月間の記事一覧

Rubyへの移植を挑戦

最近ちょっとPerlでのスクレイピングに限界を感じてきたので、オブジェクト指向がもっと簡単に使えるRubyを使ってみることにしました。 HTMLパーサとして使えそうなので、「Nokogiri」というモジュールがあったのでコレをインストールしてみようと思っていま…

行の属性判断の元になった単語を強調表示

今回も新たな論文レビューについて行属性判断プログラムを走らせてみて、その結果を見ながら想定どおりに示唆ベクトルが出なかった行を見つけてきて、その行に特徴的な単語を探して辞書に追加する作業を行いました。 そこで、この示唆辞書も大きくなってきて…

示唆単語追加

前回に引き続き、プログラムがそれぞれの行がどの属性であるかを推測するするための単語群を見直し、いくつか単語を追加しました。 まず、どの示唆ベクトルの値も0になってしまう行は無くなってほしいので、とりあえずその行を狙って修正をかけるようにしま…

HMMからの属性決定調整

今回は新たに追加された新着論文レビューに対し、文章解析が上手く行われるようにプログラム・パラメータの調整を行いました。 まずはHMMのプログラムの調整ですが、前回発見したバグは、Perlで配列のインデックスを「-1」にすると、配列の最後の要素を指し…

FABSページの使い方更新&文章解析プログラム調整

前回に引き続き、FABSのページの更新作業を行いました。今回はgackelさんの方の紹介ページも作成しつつ、ページの構成・文章の手直しなど、公開されているプログラムをどうやって使うのかがすぐに分かるようにしました。トップページから二つのプロジェクト…

FABSページ更新の続き

FABSのトップページにプログラム紹介を置くのはごちゃごちゃして見づらいので、プログラムの使い方や紹介のページは別にもうけることにして、トップページはシンプルにすることにしました。 まずはプログラムページの見方や使い方を作るページを作成しました…

FABSページ更新でバージョンアップ

プログラム公開ベージFABSを見直すことにして、前回インストールしたWebページエディタのKompoZerを使い倒してみました。このソフトだけでWebページを見ながら中身を直接編集、細かいHTMLソースを手直し、CSSの自動追加・編集などの機能が全て使え、割とさく…

extractLinesその他プログラムのCGI化&Webページ再考

だいたいプログラムが形になってきたので、現状をWebブラウザから確認できるようにCGIとしてプログラムを組み直しました。FABSのページからレビューを確認し、「文章解析ハイライト(仮)別枠表示」というリンクを増やしておいたので、それをクリックしてもら…