Linux中使用wget进行下载的方法
07-19
使用举例:
1、下载单个文件
代码如下:
$ wget http://osmond.cn/cdbe/CDBE.zip
2、以续传方式后台下载单个文件
代码如下:
$ wget -bc http://ftp.hostrino.com/pub/centos/5.0/isos/i386/CentOS-5.0-i386-bin-
3、只下载单一HTML文件,确保影响着页面显示的所有元素均被下载,并重新建立链接
代码如下:
$ wget -p -k http://osmond.cn/cdbe/manual/index.html
4.下载www.xxx.org/pub/path/整个目录
代码如下:
wget -c -r -np -k -L -p www.xxx.org/pub/path/
在下载时。有用到外部域名的图片或连接。如果需要同时下载就要用-H参数。
代码如下:
wget -np -nH -r --span-hosts www.xxx.org/pub/path/
-c 断点续传
-r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件
-nd 递归下载时不创建一层一层的目录,把所有的文件下载到当前目录
-np 递归下载时不搜索上层目录,如wget -c -r www.xxx.org/pub/path/
没有加参数-np,就会同时下载path的上一级目录pub下的其它文件
-k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数
-L 递归时不进入其它主机,如wget -c -r www.xxx.org/
如果网站内有一个这样的链接:
www.yyy.org,不加参数-L,就会像大火烧山一样,会递归下载www.yyy.org网站
-p 下载网页所需的所有文件,如图片等
-A 指定要下载的文件样式列表,多个样式用逗号分隔
-i 后面跟一个文件,文件内指明要下载的URL
5、下载整个网站做本地镜像网站 http://www.xyz.edu.cn 的内容
代码如下:
$ wget –m –l4 -t0 http://www.xyz.edu.cn
或者
代码如下:
wget -r -p -np -k http://dsec.pku.edu.cn/~usr_name/
6、只下载网站指定的目录,避免向远程主机的其他目录扩散,并拒绝下载gif和jpg文件
代码如下:
$ wget -r –L -R gif,jpg http://www.xyz.edu.cn/doc/
7、递归下载 http://www.xyz.edu.cn 下的 blog 和 wiki 目录并将文件后缀存为html
代码如下:
$ wget -r -k -p -np -E -I blog,wiki http://www.xyz.edu.cn
8、递归下载 http://ayo.freshrpms.net/redhat/9/i386/updates/RPMS 的所有文件到当前目录
代码如下:
$ wget -r -nH -nd http://ayo.freshrpms.net/redhat/9/i386/updates/RPMS
9、批量下载(首先将每个要下载文件的URL写一行,生成文件 download.txt)
代码如下:
$ wget -i download.txt -o download.log
10、使用代理下载
代码如下:
$ wget -Y -i download.txt -o download.log
代理可以在环境变量或wgetrc文件中设定
如何设置代理
代码如下:
# 在环境变量中设定代理
export PROXY=http://214.97.161.94:80/
# 在~/.wgetrc中设定代理
http_proxy = http://214.97.161.94:80/
ftp_proxy = http://214.97.161.94:80/
11.* 在不稳定的网络上下载一个部分下载的文件,以及在空闲时段下载
代码如下:
wget -t 0 -w 31 -c http://dsec.pku.edu.cn/BBC.avi -o down.log &
# 或者从filelist读入要下载的文件列表
wget -t 0 -w 31 -c -B ftp://dsec.pku.edu.cn/linuxsoft -i filelist.txt -o
down.log &