原因は特定…されど

 どうやら、HTML::TreeBuilderで文章をパースした際に、「&」が頭につく文字参照が含まれていると、場合によってはUTF8フラグがついて、全体が文字化けてしまうようです。
 個人的には、「&」がつく部分はそのままにしておいてほしいのに、HTML::Element->as_text()により、対応する文字に変更されてしまうことが問題なようです。このことはみなさん悩まされているようで、特にHTML::TreeBuilderで日本語と文字参照を扱う場合の手順のページで紹介されているやり方が良いように思いました。いろいろ試してみて、なんとか解決を図ろうと思います。