htmlの要素をいろいろ扱うのに便利にゃ物体。
use WWW::Mechanize;
use Web::Scraper;
my $host = 'nekoneko.com';
my $user = 'admin';
my $pass = 'password';
my $url = "http://$host/info";
my $mech = WWW::Mechanize->new();
$mech->get( $url );
$mech->set_visible( $user, $pass ) ;
$mech->click( "login" , 0 , 0 );
my $html = $mech->content;
my $scraper = scraper {
process '//table/tr/td' , 'desc[]' => 'TEXT';
};
my $res = $scraper->scrape($mech->content, $mech->uri);
これで$res->{desc}にtableのtdがリストで入る。cssとかxpathとかごりごりすればもっと何でも出来る気味。
xpathはコマンドラインでscraperを起動するとtry&err出来るので囓りにゃがら何とかにゃるんじゃにゃいかにゃ、と。