OpenOfficeとの格闘&PerlのHTML::TreeBuilder

 前回MeCab解析したのを成形して印刷しようと、初めてOpenOfficeなるものを使ってみた。余白の設定とか行数指定に文字の最大Ptいじらなきゃならないとか、いろいろ面倒で結構時間食ってしまったorz しかも段組みの表示がバグってしまってなんだこりゃあ。まぁなんとか上手く印刷できたんで、これ見ながら生物用語をどうやって拾いだすか考えてみます。
 それと、HTMLをパースして、タグから情報を引き出すTreeBuilderなるモジュールをインストールしてみた。とりあえず狙ったタグの文字を引き出すコードが書けました。目標としては、生物用語を引き出したいページのURLを受け取って、そのページを解析できるようにしたいです。
 ほむ、今月から正規雇用となりました。なんとか今月中にはプロトタイプまでは完成させたい…が、時間的にきついか?まずは頑張ってみますか。