MeCab on Perl 試行

 MacMeCabインストールしたので、次はPerlで全文解析。
 とりあえずIDEEclipseで、Perlの環境を作成。無駄にPadwalkerのインストールに時間食ったけど、Macならcpanをインストールして、
$ cpan install PadWalker 
で余裕でインストールできたorz
 新着論文レビューから2011年4月18日発表の『in vitroでマウスの精子幹細胞から生殖能のある精子を産生することに成功』の論文をテキストにコピペして、Perlから
open FH, "< In_vitro.txt";
while ($list = ) {
}
で読み込んで、ファイルに書き出すまでできた。
 せっかくPerl使ってるんだし、直接ウェブページから読み出せるようにしようと思います。
 解析して得たデータを見てみると、一応日本語の文法としては間違った解釈はでないんですね、さすがMeCab。というわけで、これを元に論文の重要成分を判別するって感じでまずは攻めてみようかな。あとは日本語形態解析についても理解を深めて、辞書の方に手を加えられたらと思いますが、うまくいくかな?