UserPreferences

UselessCode/HrefList


HTMLファイルから href= のとこだけひっぱってくる。
#! /usr/bin/perl

# 引数をURLにしたいときはこれを有効にして下の<> を<HTML>にする。
#open(HTML, "wget -Q 200K -O - $ARGV[0]|") or die "I can't open $ARGV[0]";
$html = "";
while (<>) {
  $html .= $_;
}

$html =~ s/^([^<]*)</</g;
$html =~ s/>[^<]*</></g;
$html =~ s/<[^>]*\shref\s*\=\s*\"?([^\"]+)\"?[^>]*>/$1\n/ig;
$html =~ s/<[^>]*>//g;

print $html;