OpenOfficeとの格闘＆PerlのHTML::TreeBuilder

　前回MeCab解析したのを成形して印刷しようと、初めてOpenOfficeなるものを使ってみた。余白の設定とか行数指定に文字の最大Ptいじらなきゃならないとか、いろいろ面倒で結構時間食ってしまったorz　しかも段組みの表示がバグってしまってなんだこりゃあ。まぁなんとか上手く印刷できたんで、これ見ながら生物用語をどうやって拾いだすか考えてみます。
　それと、HTMLをパースして、タグから情報を引き出すTreeBuilderなるモジュールをインストールしてみた。とりあえず狙ったタグの文字を引き出すコードが書けました。目標としては、生物用語を引き出したいページのURLを受け取って、そのページを解析できるようにしたいです。
　ほむ、今月から正規雇用となりました。なんとか今月中にはプロトタイプまでは完成させたい…が、時間的にきついか？まずは頑張ってみますか。