新規チャンクの取得を全論文レビューを対象にする

 前回作成した、現在のチャンクリストを利用して行の属性推定を行った後に、そこに使用されている未登録チャンクを抽出するというコードを拡張し、全ての論文レビューを巡回してきて、未登録チャンクを回収するというように、プログラムの作成と修正を行いました。
 まず大きく変えたのは行推定を行うRubyモジュールで、サイトを巡回ときにレビューごとにファイルを開閉していると時間がかかるので、initializeメソッド内で使用するファイルを全て開き、新たにfinalizeメソッドを追加し、ここで全てのファイルへ書き込んで閉じるというように変更しました。これに伴いオブジェクト変数も増やし、このモジュールを使用するプログラムでfinalizeメソッドを呼び出すことを強制するようになりました。
 この変更により、従来のように一つのレビューをモジュールに渡して実行することもできるし、今回の目的である、複数ページを一度にモジュールに渡して演算実行できるようになりました。手元のPCで一度に5つのレビューを渡して上手く動くことも確認できました。
 この後牧場のマシンで全レビューを渡そうとしましたが、”)”のような記号がチャンクに含まれていると正規表現エラーがでてしまうというバグがでてしまいました。次回ここを修正して、新規チャンクを取得しようと思います。