HTML::Highlightを用いて、頻度ファイルからページにハイライト

 Htmlファイルの特定の文字列について、ハイライトのためのタグを導入してくれるモジュール「HTML::Highlight」をインストールして、現在テキストファイルになっている頻度計算ファイルの単語をつかって、元ページにハイライトを追加してみました。新着論文レビューの論文、「mTORとオートファジーとが共存するコンパートメントにより補強される細胞の分泌表現型」について、ハイライトを追加したhtmlを表示したところをキャプチャしました。

 今のところでは、Htmlのtitleのところにもタグが入ってしまったり、文章中でも、たとえば「細胞」と「がん細胞」が検索文字に入っていた場合、「<>がん<>細胞<><>」のように二重にタグが入ってしまうことが起こったりしてしまって、まだまだ問題が山積しています。また、頻度解析ファイルにも余計な文字が入ってしまっているので、ここも今後調整していく必要があります。
 現状のプログラムでは、Htmlを直接書き換えてしまっていますが、JavaScriptを使えばブックマークレットのようにしてハイライト表示をさせることができるとも思われます。そうなるとPerlプログラムとの連携がどうなるのかまだ分かりませんが、今後その方面から調べていくことにしたいと思います。