取得した新規チャンクを推定用チャンクリストに追加

 論文レビューの数を50〜70ぐらいに制限しながら、属性推定に使えそうなチャンクを自動回収させるプログラムを走らせてみました。これぐらいの数のとき、「今後、」とか「詳細に」といったチャンクが取得できていることが分かったので、今度はそれを属性推定に用いているチャンクリストに新たに登録してから、再びチャンクの自動回収プログラムを走らせてみました。
 属性推定チャンクリストをいじれば、その分属性推定の精度も上がり、新たなチャンクを得ようとするときそのチャンクの分類精度があがるので、有効なチャンクを入手しやすくなると考えられます。実際に実行してみる度に新たな有効チャンクが回収できているようでした。
 ここで属性推定用のチャンクリストが更新されたので、これを利用した論文レビューの行属性推定プログラムを走らせてみたところ、以前結論と思われる行が誤って前提だと解釈されていたような行が、きちんと結論だと推定されるようになるなど、推定精度が向上しているようでした。
 前回までに属性推定のモジュール、chromHMM.rbを大きく改造していたので、これをg86サーバに移行しつつ、新たな属性推定用チャンクリストもサーバにアップロードしたので、プログラムの実行結果をウェブから見ることができます。
 今後、属性ごとに振り分けられた行を利用して、レビュー間検索や一覧表示などの機能を実装していきたいと思います。