つぶねこ

つぶねこ

＠もじらもーど。

2009/6/16 4:19 ▲≡

さいきんのソフト試用 perl Web::Scraper

　htmlの要素をいろいろ扱うのに便利にゃ物体。
　

use WWW::Mechanize;
use Web::Scraper;
my $host = 'nekoneko.com';
my $user = 'admin';
my $pass = 'password';
my $url = "http://$host/info";
my $mech = WWW::Mechanize->new();
$mech->get( $url );
$mech->set_visible( $user, $pass ) ;
$mech->click( "login" , 0 , 0 );
my $html = $mech->content;
my $scraper = scraper {
    process '//table/tr/td' , 'desc[]' => 'TEXT';
};
my $res = $scraper->scrape($mech->content, $mech->uri);

　これで$res->{desc}にtableのtdがリストで入る。cssとかxpathとかごりごりすればもっと何でも出来る気味。
　xpathはコマンドラインでscraperを起動するとtry&err出来るので囓りにゃがら何とかにゃるんじゃにゃいかにゃ、と。

Index

↑
2009/07/06 06:16　
2009/07/05 20:43　
2009/07/05 05:58　
2009/07/04 15:32　
2009/07/04 06:22　
2009/07/04 01:02　
2009/07/03 21:01　
2009/07/03 06:12　
2009/07/03 04:47　
2009/07/02 15:13　
2009/07/02 06:39　
2009/07/02 00:50　
2009/07/01 21:29　
2009/07/01 12:05　
2009/07/01 05:54　
2009/06/30 20:22　
2009/06/30 10:52　
2009/06/30 01:18　
2009/06/29 15:39　
2009/06/29 06:05　
2009/06/29 01:21　
2009/06/28 15:34　
2009/06/28 05:59　
2009/06/28 02:44　
2009/06/27 11:04　
2009/06/27 04:17　
2009/06/27 02:07　
2009/06/26 21:04　
2009/06/26 10:55　
2009/06/26 02:46　
2009/06/25 21:02　
2009/06/25 10:52　
2009/06/25 01:19　
2009/06/24 16:52　
2009/06/24 10:04　
2009/06/24 01:50　
2009/06/23 19:13　
2009/06/23 10:26　
2009/06/22 18:55　
2009/06/21 09:56　
2009/06/21 01:06　
2009/06/20 09:34　
2009/06/20 01:53　
2009/06/19 15:03　
2009/06/19 01:18　
2009/06/18 21:09　
2009/06/18 02:21　
2009/06/17 15:43　
2009/06/17 02:37　
2009/06/16 21:01　
⇒ 2009/06/16 04:19　
2009/06/15 10:01　
2009/06/15 01:18　
2009/06/14 09:55　
2009/06/14 03:41　
2009/06/14 02:42　
2009/06/13 20:27　
2009/06/13 09:47　
2009/06/12 18:39　
2009/06/11 06:39　
2009/06/10 10:24　
2009/06/09 09:31　
2009/06/09 02:19　
2009/06/08 23:37　
2009/06/08 01:30　
2009/06/07 21:25　
2009/06/07 12:19　
2009/06/06 17:40　
2009/06/05 12:04　
2009/06/04 20:45　
2009/06/04 16:59　
2009/06/03 20:35　
2009/06/03 14:46　
2009/06/02 22:21　
2009/06/01 21:56　
2009/06/01 21:22　
2009/05/31 21:33　
2009/05/31 01:04　
2009/05/30 12:03　
2009/05/29 22:17　
2009/05/28 15:34　
2009/05/28 07:10　
2009/05/27 20:28　
2009/05/26 02:06　
2009/05/26 01:31　
2009/05/25 17:01　
2009/05/24 10:52　
2009/05/24 01:47　
2009/05/23 19:49　
2009/05/23 11:08　
2009/05/22 02:57　
2009/05/22 01:26　
2009/05/21 19:55　
2009/05/20 01:33　
2009/05/19 16:30　
2009/05/18 18:11　
2009/05/17 10:54　
2009/05/16 01:46　
2009/05/15 14:52　
2009/05/14 01:35　
2009/05/13 10:18　
↓