我都是這樣子抓具有連續檔名的網址
jon 在 Tsung's Blog 發表了這篇《抓檔 & 更改檔名》,用 PHP 寫能夠抓具有連續檔名的網址的程式。其實不必這麼麻煩,用一行 shell 指令即可搞定:
SHELL> jot 10 11 20 \ | xargs printf "http://url/pic%03d.jpg\n" \ | xargs -n 1 wget \ ;
至於更改檔名會稍微麻煩一點,不過還是可以用一行搞定:
SHELL> jot 10 11 20 \ | awk '{ print $1, $1; }' \ | xargs -n 2 printf "%03d.jpg http://url/pic%03d.jpg\n" \ | xargs -t -n 2 wget -O \ ;
除非覺得沒有 multi-thread 下載會不夠快,否則這樣子應該夠及的上幹圖王的部分功能了。
註:要 parse HTML,也是可以一行搞定的。
One Comment
用 curl 更快
% curl -O http://url/filename11-20.jpg
Post a Comment