ダイアリーの archive ページから日付とカテゴリーを取り出す
日記のカテゴリーの管理(このカテゴリーは最近使ってないだとか、このカテゴリーは今まで何件使っただとか)をしてみたいと思い、そのための下準備プログラム。
#!/usr/bin/perl use strict; use warnings; use LWP::UserAgent; my $ua = LWP::UserAgent->new; $ua->agent('PerlSample/0.1'); $ua->timeout(5); my $addres = "http://d.hatena.ne.jp/s_kanda/archive/200611"; my $response = $ua->get($addres); if (! $response->is_success) { die "get error.\n"; } my $buf = $response->content; my @list = split( /\n/, $buf ); foreach my $wk (@list){ $_ = $wk; if(/(\d{4}-\d{2}-\d{2})/){ print "$1\n"; next; } if(/\[.+sectioncategory.+\>(.+)\<\/a\>\]/){ print "$1\n"; next; } } print "\nend.\n";
あまり良いコードではないと思うのだけれど。
実行結果
2006-11-26 Perl 2006-11-25 はてな 2006-11-23 ネット 2006-11-21 音楽 2006-11-18 音楽 2006-11-12 Perl 2006-11-04 大阪ライフ 2006-11-03 Perl end.
来週続きをしよう。