行の属性判断の元になった単語を強調表示

 今回も新たな論文レビューについて行属性判断プログラムを走らせてみて、その結果を見ながら想定どおりに示唆ベクトルが出なかった行を見つけてきて、その行に特徴的な単語を探して辞書に追加する作業を行いました。
 そこで、この示唆辞書も大きくなってきて、辞書に含まれるどの単語がその行に含まれているのかが自分でも分からなくなってきたので、行の中で辞書中の単語が出現した部分を強調表示するようなプログラムを作ってみました。
 単純にもとのHTMLについて、辞書内の単語と正規表現マッチをとって、下線がつくようにuタグをつけて置換するというだけの動作です。suggestAttr.pmとしてモジュール化し、ハイライトを入れる前に呼び出すようにもとのプログラムも変更しました。
 まだこのモジュールは実用段階に無いのでWebサービス上では動かしておらず、下線は入りません。手元で確認の為に使っていますが、表示した方がよいと思われるようになったら、このプログラムもWeb上で動くようにしたいと思います。