WWW::Wikipediaモジュールを試す
Wikipediaの本文を得る為に、検索などを織り交ぜながらマイニングできたらいいなと思い、いろいろ調べるうちに、「WWW::Wikipedia」というモジュールがCPANにあることが判明し、早速使ってみました。
my $wiki = WWW::Wikipedia->new(language => 'ja');
$result = $wiki->search($line);
if ($result) {
print "Got the contents of '$line'.\n";
}
else {
print "Cannot get content of '$line'.\n";
$wiki->error;
next;
}
open FH, ">./wikiTest/$line.txt" or die "open: $!";
print FH Encode::encode('utf-8', $result->raw);
という感じで使用してみましたが、私が作ったモジュールで得られなかったページは、やっぱりこのモジュールでも得られなかったので、Web検索エンジンを用いてテキストを得ている訳ではないようでした。残念。
Web上の検索エンジンをPerlプログラムから呼び出して、目的のページに至れるような探索プログラムを作りたいのですが、今後も自分で作成しつつ、何か便利なツールがないか探していこうと思います。