wget
wget是一个从网络上自动下载文件的自由工具,支持通过HTTP、HTTPS、FTP三个最常见的TCP/IP协议下载,并可以使用HTTP代理。wget名称的由来是“World Wide Web”与“get”的结合。
1、wget下载单个文件
#wget http://domain/file
下载的时候会显示:文件的大小、保存的名称、进度条、下载速度、时间
root@kali:~# wget https://curl.haxx.se/download/curl-7.54.1.zip
--2017-07-09 03:26:46-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:5189701 (4.9M) [application/zip]
正在保存至: “curl-7.54.1.zip”
curl-7.54.1.zip 12%[===========> ] 639.25K 30.7KB/s eta 2m 8s ^
2、指定保存的名称
#wget -O newName http://domain/file
默认情况wget会用斜杠‘/’后面的字符来命名保存的名称
root@kali:~# wget http://xiazai.zol.com.cn/down.php?softid=442597&subcateid=1446&site=10&checkStr=066ab9d88b1f0c534&pos=downloader_main&rand=1200a2
正在保存至: “down.php?softid=442597”
显然这种特殊格式下载地址得出的命名不是我们想要的,即可用-O参数来自定义命名
root@kali:~# wget -O testName http://xiazai.zol.com.cn/down.php?softid=442597&subcateid=1446&site=10&checkStr=066ab9d88b1f0c534&pos=downloader_main&rand=1200a2
[1] 6613
[2] 6614
[3] 6615
[4] 6616
[5] 6617
root@kali:~# --2017-07-09 03:36:20-- http://xiazai.zol.com.cn/down.php?softid=442597
正在解析主机 xiazai.zol.com.cn (xiazai.zol.com.cn)... 123.103.57.124
正在连接 xiazai.zol.com.cn (xiazai.zol.com.cn)|123.103.57.124|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:0 [text/html]
正在保存至: “testName”
testName [ <=> ] 0 --.-KB/s in 0s
3、断点续传
#wget -c http://domain/file
适用于下载大文件或者网络不好的情况,需要服务器支持断点续传
不停重连,直到连接成功
root@kali:~# wget -c https://curl.haxx.se/download/curl-7.54.1.zip
-t参数表示重连次数,表示只重连10次,-t为0时不限制
root@kali:~# wget -c -t 10 https://curl.haxx.se/download/curl-7.54.1.zip
-T参数表示超时等待时间,以秒为单位,表示60秒连不上超时
root@kali:~# wget -c -T 60 https://curl.haxx.se/download/curl-7.54.1.zip
4、指定下载速度
#wget --limit-rate=1024k http://domain/file
表示限制速度为1MB/s
root@kali:~# wget --limit-rate=1024k https://curl.haxx.se/download/curl-7.54.1.zip
--2017-07-09 04:05:49-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:5189701 (4.9M) [application/zip]
正在保存至: “curl-7.54.1.zip.1”
curl-7.54.1.zip.1 11%[==========> ] 599.33K 1021.3KB/s eta 54s ^
5、批量下载
#wget -i download.txt
多个下载链接可以分行写在文本中,实现批量下载
6、选择性下载
#wget -m --accept=jpg http://domain/dir //--accept参数表示可以接受的文件类型
#wget -m --reject=jpg http://domain/dir //--reject参数表示拒绝接受的文件类型
或者
#wget -r -A.jpg http://domain/dir //表示下载所有jpg文件
7、后台下载
#wget -b http://domain/file
后台下载时,会在当前目录中产生wget-log文件
root@kali:~# wget -b https://curl.haxx.se/download/curl-7.54.1.zip
继续在后台运行,pid 为 6705。
将把输出写入至 “wget-log”。
root@kali:~# cat wget-log
--2017-07-09 04:24:31-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.74.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.74.49|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:5189701 (4.9M) [application/zip]
正在保存至: “curl-7.54.1.zip.4”
0K .......... .......... .......... .......... .......... 0% 74.9K 67s
50K .......... .......... .......... .......... .......... 1% 88.6K 61s
100K .......... .......... .......... .......... .......... 2% 49.8K 73s
8、利用代理服务器下载
如果下载需要经过代理服务器,wget可以通过代理服务器进行下载。
方法一、在环境变量中设置代理
export http_proxy=0.0.0.0:8080
方法二、使用配置文件
可以直接修改/etc/wgetrc,也可以当前目录下创建.wgetrc文件,配置代理服务器
https-proxy = 0.0.0.0:8080 //https代理服务器
http-proxy = 0.0.0.0:8080 //http代理服务器
ftp-proxy = 0.0.0.0:8080 //ftp代理服务器
use_proxy = on //开启代理
这里 use_proxy = on 开启了代理,如果不想使用代理,每次都修改此文件太麻烦,我们可以在命令中使用-Y参数来临时设置:
-Y, --proxy=on/off 打开或关闭代理
方法三、使用-e参数
适用于临时代理
-e参数表示运行一个“.wgetrc”风格的命令
#wget -e "http-proxy=0.0.0.0:8080" http://domain/file
注意:如果代理服务器需要密码则使用
--proxy-user=代理用户
--proxy-passwd=代理密码
9、测试下载地址是否有效
#wget --spider DOWNLOAD-URL
正确的下载地址会显示
root@kali:~# wget --spider https://curl.haxx.se/download/curl-7.54.1.zip
打开 Spider 模式。检查是否存在远程文件。
--2017-07-09 04:53:33-- https://curl.haxx.se/download/curl-7.54.1.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.78.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.78.49|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度:5189701 (4.9M) [application/zip]
存在远程文件。
无效的下载地址会显示
root@kali:~# wget --spider https://curl.haxx.se/download/xxx.zip
打开 Spider 模式。检查是否存在远程文件。
--2017-07-09 04:53:45-- https://curl.haxx.se/download/xxx.zip
正在解析主机 curl.haxx.se (curl.haxx.se)... 151.101.78.49
正在连接 curl.haxx.se (curl.haxx.se)|151.101.78.49|:443... 已连接。
已发出 HTTP 请求,正在等待回应... 404 Not Found
远程文件不存在 -- 链接失效!!!
10、FTP下载
匿名FTP
wget ftp-url
需登陆认证的FTP
wget --ftp-user=USERNAME --ftp-password=PASSWORD DOWNLOAD-URL
11、针对提示没有认证不允许下载
wget --no-check-certificate DOWNLOAD-URL //不要验证服务器的证书。
12、下载一个完整的网站
适用于完整下载一个网站用于本地浏览
wget --mirror -p --convert-links -P LOCAL-DIR WEBSITE-URL
--mirror:打开镜像选项-p:下载所有用于显示给定网址所必须的文件--convert-links:下载以后,转换链接用于本地显示-P LOCAL_DIR:保存所有的文件或目录到指定的目录下
待更新。。。