linux命令如何重试几次_Linux下wget命令详解

Ⅰ linux系统中的curl命令使用教程

命令：curl
在Linux中curl是一个利用URL规则在命令行下工作的文件传输工具，可以说是一款很强大的http命令行工具。它支持文件的上传和下载，是综合传输工具，但按传统，习惯称url为下载工具。
语法：# curl [option] [url]
常见参数：
-A/--user-agent 设置用户代理发送给服务器
-b/--cookie
-c/--cookie-jar 操作结束后把cookie写入到这个文件中
-C/--continue-at 断点续转
-D/--mp-header 把header信息写入到该文件中
-e/--referer 来源网址
-f/--fail 连接失败时不显示http错误
-o/--output 把输出写到该文件中
-O/--remote-name 把输出写到该文件中，保留远程文件的文件名
-r/--range 检索来自HTTP/1.1或FTP服务器字节范围
-s/--silent 静音模式。不输出任何东西
-T/--upload-file 上传文件
-u/--user
-w/--write-out [format] 什么输出完成后
-x/--proxy
-#/--progress-bar 进度条显示当前的传送状态
例子：
1、基本用法
代码如下:
# curl http://www.linux.com
执行后，www.linux.com 的html就会显示在屏幕上了
Ps：由于安装linux的时候很多时候是没有安装桌面的，也意味着没有浏览器，因此这个方法也经常用于测试一台服务器是否可以到达一个网站
2、保存访问的网页
2.1:使用linux的重定向功能保存
代码如下:
# curl http://www.linux.com linux.html
2.2:可以使用curl的内置option:-o(小写)保存网页
代码如下:
$ curl -o linux.html http://www.linux.com
执行完成后会显示如下界面，显示100%则表示保存成功
% Total % Received % Xferd Average Speed Time Time Time Current
Dload Upload Total Spent Left Speed
100 79684 0 79684 0 0 3437k 0 --:--:-- --:--:-- --:--:-- 7781k
2.3:可以使用curl的内置option:-O(大写)保存网页中的文件
要注意这里后面的url要具体到某个文件，不然抓不下来
代码如下:
# curl -O http://www.linux.com/hello.sh
3、测试网页返回值
代码如下:
# curl -o /dev/null -s -w %{http_code} www.linux.com
Ps:在脚本中，这是很常见的测试网站是否正常的用法
4、指定proxy服务器以及其端口
很多时候上网需要用到代理服务器(比如是使用代理服务器上网或者因为使用curl别人网站而被别人屏蔽IP地址的时候)，幸运的是curl通过使用内置option：-x来支持设置代理
代码如下:
# curl -x 192.168.100.100:1080 http://www.linux.com
5、cookie
有些网站是使用cookie来记录session信息。对于chrome这样的浏览器，可以轻易处理cookie信息，但在curl中只要增加相关参数也是可以很容易的处理cookie
5.1:保存http的response里面的cookie信息。内置option:-c(小写)
代码如下:
# curl -c cookiec.txt http://www.linux.com
执行后cookie信息就被存到了cookiec.txt里面了
5.2:保存http的response里面的header信息。内置option: -D
代码如下:
# curl -D cookied.txt http://www.linux.com
执行后cookie信息就被存到了cookied.txt里面了
注意：-c(小写)产生的cookie和-D里面的cookie是不一样的。
5.3:使用cookie
很多网站都是通过监视你的cookie信息来判断你是否按规矩访问他们的网站的，因此我们需要使用保存的cookie信息。内置option: -b
代码如下:
# curl -b cookiec.txt http://www.linux.com
6、模仿浏览器
有些网站需要使用特定的浏览器去访问他们，有些还需要使用某些特定的版本。curl内置option:-A可以让我们指定浏览器去访问网站
代码如下:
# curl -A "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.0)" http://www.linux.com
这样服务器端就会认为是使用IE8.0去访问的
7、伪造referer(盗链)
很多服务器会检查http访问的referer从而来控制访问。比如：你是先访问首页，然后再访问首页中的邮箱页面，这里访问邮箱的referer地址就是访问首页成功后的页面地址，如果服务器发现对邮箱页面访问的referer地址不是首页的地址，就断定那是个盗连了
curl中内置option：-e可以让我们设定referer
代码如下:
# curl -e "www.linux.com" http://mail.linux.com
这样就会让服务器其以为你是从www.linux.com点击某个链接过来的
8、下载文件
8.1：利用curl下载文件。
代码如下:
#使用内置option：-o(小写)
# curl -o dodo1.jpg http:www.linux.com/dodo1.JPG
#使用内置option：-O(大写)
# curl -O http://www.linux.com/dodo1.JPG
这样就会以服务器上的名称保存文件到本地
8.2：循环下载
有时候下载图片可以能是前面的部分名称是一样的，就最后的尾椎名不一样
代码如下:
# curl -O http://www.linux.com/dodo[1-5].JPG
这样就会把dodo1，dodo2，dodo3，dodo4，dodo5全部保存下来
8.3：下载重命名
代码如下:
# curl -O http://www.linux.com/{hello,bb}/dodo[1-5].JPG
由于下载的hello与bb中的文件名都是dodo1，dodo2，dodo3，dodo4，dodo5。因此第二次下载的会把第一次下载的覆盖，这样就需要对文件进行重命名。
代码如下:
# curl -o #1_#2.JPG http://www.linux.com/{hello,bb}/dodo[1-5].JPG
这样在hello/dodo1.JPG的文件下载下来就会变成hello_dodo1.JPG,其他文件依此类推，从而有效的避免了文件被覆盖
8.4：分块下载
有时候下载的东西会比较大，这个时候我们可以分段下载。使用内置option：-r
复制代码
代码如下:
# curl -r 0-100 -o dodo1_part1.JPG http://www.linux.com/dodo1.JPG
# curl -r 100-200 -o dodo1_part2.JPG http://www.linux.com/dodo1.JPG
# curl -r 200- -o dodo1_part3.JPG http://www.linux.com/dodo1.JPG
# cat dodo1_part* dodo1.JPG
这样就可以查看dodo1.JPG的内容了
8.5：通过ftp下载文件
curl可以通过ftp下载文件，curl提供两种从ftp中下载的语法
代码如下:
# curl -O -u 用户名:密码 ftp://www.linux.com/dodo1.JPG
# curl -O ftp://用户名:密码@www.linux.com/dodo1.JPG
8.6：显示下载进度条
代码如下:
# curl -# -O http://www.linux.com/dodo1.JPG
8.7：不会显示下载进度信息
代码如下:
# curl -s -O http://www.linux.com/dodo1.JPG
9、断点续传
在windows中，我们可以使用迅雷这样的软件进行断点续传。curl可以通过内置option:-C同样可以达到相同的效果
如果在下载dodo1.JPG的过程中突然掉线了，可以使用以下的方式续传
复制代码
代码如下:
# curl -C -O http://www.linux.com/dodo1.JPG
10、上传文件
curl不仅仅可以下载文件，还可以上传文件。通过内置option:-T来实现
复制代码
代码如下:
# curl -T dodo1.JPG -u 用户名:密码 ftp://www.linux.com/img/
这样就向ftp服务器上传了文件dodo1.JPG
11、显示抓取错误
复制代码
代码如下:
# curl -f http://www.linux.com/error
其他参数(此处翻译为转载)：
-a/--append 上传文件时，附加到目标文件
--anyauth 可以使用“任何”身份验证方法
--basic 使用HTTP基本验证
-B/--use-ascii 使用ASCII文本传输
-d/--data HTTP POST方式传送数据
--data-ascii 以ascii的方式post数据
--data-binary 以二进制的方式post数据
--negotiate 使用HTTP身份验证
--digest 使用数字身份验证
--disable-eprt 禁止使用EPRT或LPRT
--disable-epsv 禁止使用EPSV
--egd-file 为随机数据(SSL)设置EGD socket路径
--tcp-nodelay 使用TCP_NODELAY选项
-E/--cert
--cert-type 证书文件类型 (DER/PEM/ENG) (SSL)
--key 私钥文件名 (SSL)
--key-type 私钥文件类型 (DER/PEM/ENG) (SSL)
--pass 私钥密码 (SSL)
--engine 加密引擎使用 (SSL). "--engine list" for list
--cacert CA证书 (SSL)
--capath CA目 (made using c_rehash) to verify peer against (SSL)
--ciphers SSL密码
--compressed 要求返回是压缩的形势 (using deflate or gzip)
--connect-timeout 设置最大请求时间
--create-dirs 建立本地目录的目录层次结构
--crlf 上传是把LF转变成CRLF
--ftp-create-dirs 如果远程目录不存在，创建远程目录
--ftp-method [multicwd/nocwd/singlecwd] 控制CWD的使用
--ftp-pasv 使用 PASV/EPSV 代替端口
--ftp-skip-pasv-ip 使用PASV的时候,忽略该IP地址
--ftp-ssl 尝试用 SSL/TLS 来进行ftp数据传输
--ftp-ssl-reqd 要求用 SSL/TLS 来进行ftp数据传输
-F/--form
-form-string
-g/--globoff 禁用网址序列和范围使用{}和[]
-G/--get 以get的方式来发送数据
-h/--help 帮助
-H/--header 自定义头信息传递给服务器
--ignore-content-length 忽略的HTTP头信息的长度
-i/--include 输出时包括protocol头信息
-I/--head 只显示文档信息
-j/--junk-session-cookies 读取文件时忽略session cookie
--interface 使用指定网络接口/地址
--krb4 使用指定安全级别的krb4
-k/--insecure 允许不使用证书到SSL站点
-K/--config 指定的配置文件读取
-l/--list-only 列出ftp目录下的文件名称
--limit-rate 设置传输速度
--local-port 强制使用本地端口号
-m/--max-time 设置最大传输时间
--max-redirs 设置最大读取的目录数
--max-filesize 设置最大下载的文件总量
-M/--manual 显示全手动
-n/--netrc 从netrc文件中读取用户名和密码
--netrc-optional 使用 .netrc 或者 URL来覆盖-n
--ntlm 使用 HTTP NTLM 身份验证
-N/--no-buffer 禁用缓冲输出
-p/--proxytunnel 使用HTTP代理
--proxy-anyauth 选择任一代理身份验证方法
--proxy-basic 在代理上使用基本身份验证
--proxy-digest 在代理上使用数字身份验证
--proxy-ntlm 在代理上使用ntlm身份验证
-P/--ftp-port
使用端口地址，而不是使用PASV

-Q/--quote 文件传输前，发送命令到服务器
--range-file 读取(SSL)的随机文件
-R/--remote-time 在本地生成文件时，保留远程文件时间
--retry 传输出现问题时，重试的次数
--retry-delay 传输出现问题时，设置重试间隔时间
--retry-max-time 传输出现问题时，设置最大重试时间
-S/--show-error 显示错误
--socks4
--socks5
-t/--telnet-option
--trace 对指定文件进行debug
--trace-ascii Like --跟踪但没有hex输出
--trace-time 跟踪/详细输出时，添加时间戳
--url Spet URL to work with
-U/--proxy-user
-V/--version 显示版本信息
-X/--request 指定什么命令
-y/--speed-time 放弃限速所要的时间。默认为30
-Y/--speed-limit 停止传输速度的限制，速度时间'秒
-z/--time-cond 传送时间设置
-0/--http1.0 使用HTTP 1.0
-1/--tlsv1 使用TLSv1(SSL)
-2/--sslv2 使用SSLv2的(SSL)
-3/--sslv3 使用的SSLv3(SSL)
--3p-quote like -Q for the source URL for 3rd party transfer
--3p-url 使用url，进行第三方传送
--3p-user 使用用户名和密码，进行第三方传送
-4/--ipv4 使用IP4
-6/--ipv6 使用IP6
使用curl命令获取文件下载速度
使用curl可以下载网络内容，那如何获取curl下载时的下载速度呢，使用下面的命令即可：
复制代码
代码如下:
# curl -Lo /dev/null -skw "%{speed_download}n" http://mirrors.163.com/ubuntu/ls-lR.gz
226493.000
当然，还可以获取连接时间、重定向时间等更多的数据：
复制代码
代码如下:
# curl -Lo /dev/null -skw "time_connect: %{time_connect} sntime_namelookup: %{time_namelookup} sntime_pretransfer: %{time_pretransfer} sntime_starttransfer: %{time_starttransfer} sntime_redirect: %{time_redirect} snspeed_download: %{speed_download} B/sntime_total: %{time_total} snn" http://www.sina.com
time_connect: 0.154 s
time_namelookup: 0.150 s
time_pretransfer: 0.154 s
time_starttransfer: 0.163 s
time_redirect: 0.157 s
speed_download: 324679.000 B/s
time_total: 1.692 s

Ⅱ Linux系统中wget的使用方法解析

wget是Linux系统中基于控制台的一个强大下载工具，支持HTTP和FTP协议，具有断点续传和代理服务器等功能。以下是wget的使用方法解析：

一、启动选项

-V：显示wget的版本信息。
-h：显示wget的使用说明。
-b：启动之后转入后台执行，日志文件写在当前目录下名为"wget-log"的文件中。
-e：执行一个.wgetrc文件中的指令。

二、日志文件与输入文件选项

-o：将命令的输出写入指定的文件。
-a：将命令的输出以追加方式写入指定的文件。
-d：显示调试信息。
-q：以安静模式执行（无输出）。
-v：输出详细信息。
-nv：关闭详细信息输出，但不是安静模式。
-i：从指定的文件中读取URL。

三、下载选项

-t：设置重试次数，当wget无法与服务器建立连接时，尝试连接的次数（0表示无限制）。
-O：将下载的文件保存为指定的文件名。
-nc：不覆盖已有的文件。
-c：续传文件。
-N：不取回比本地旧的文件，只下载更新的文件。
-S：显示服务器响应。
-w：在两次尝试之间等待的秒数。
-Y：通过代理服务器进行连接。
––limit-rate=：限定下载传输率，单位为字节，可以使用k,m后缀。

四、目录选项

-nd：不下载目录结构，将文件堆到当前目录里。
-x：创建与远程完全一致的目录结构。
-nH：不创建以目标主机域名为目录名的目录。
-P：将文件保存到指定的目录。
––cut-dirs=：忽略指定层数的远程目录。

五、HTTP选项

––http-user=：指定HTTP用户验证的用户。
––http-passwd=：指定HTTP用户验证的用户口令。
––no-cache：禁用服务器端的数据缓存。
-U：设定代理的名称为指定的字符串，而不是Wget/VERSION。
–referer=URL：在HTTP请求中包含Referer头。
-s：保存HTTP头到文件。
-U, –user-agent=AGENT：设定代理的名称为AGENT，而不是Wget/VERSION。

六、FTP选项

––ftp-user=：指定FTP用户。
––ftp-passwd=：指定FTP用户口令。
––passive-ftp：使用被动传输模式（缺省值）。
––active-ftp：使用主动传输模式。

七、递归下载选项

-r：打开递归下载。
-l：指定最大递归深度。
-m：开启适合用来镜像的选项。

八、递归方式的允许与拒绝选项

-A：指定允许下载的扩展文件名。
-R：指定禁止下载的扩展文件名。
-D：指定允许下载的域名。
––follow-ftp：跟踪HTML文档中的FTP链接。
-np：不要追溯到父目录。

以上是wget的主要使用方法，通过合理使用这些参数，可以大大提高下载效率和灵活性。

Ⅲ Linux系统下wget命令的使用教程

一、Linux wget简介

wget是linux上的命令行的下载工具。这是一个GPL许可证下的自由软件。Linux wget支持HTTP和FTP协议，支持代理服务器和断点续传功能，能够自动递归远程主机的目录，找到合乎条件的文件并将其下载到本地硬盘上；如果必要，Linux wget将恰当地转换页面中的超级连接以在本地生成可浏览的镜像。由于没有交互式界面，Linux wget可在后台运行，截获并忽略HANGUP信号，因此在用户推出登录以后，仍可继续运行。通常，Linux wget用于成批量地下载Internet网站上的文件，或制作远程网站的镜像。

二、实例

下载下载192.168.1.168首页并且显示下载信息Linux wget -d http://192.168.1.168下载192.168.1.168首页并且不显示任何信息wget -q http://192.168.1.168下载filelist.txt中所包含的链接的所有文件wget -i filelist.txt

下载到指定目录wget -P/tmp ftp://user:passwd@url/file把文件file下载到/tmp目录下。Linux wget是一个命令行的下载工具。对于我们这些 Linux 用户来说，几乎每天都在使用它。下面为大家介绍几个有用的 Linux wget 小技巧，可以让你更加高效而灵活的使用 Linux wget。

复制代码代码如下:$ wget -r -np -nd http://example.com/packages/这条命令可以下载 http://example.com 网站上 packages 目录中的所有文件。其中，-np 的作用是不遍历父目录，-nd 表示不在本机重新创建目录结构。

复制代码代码如下:$ wget -r -np -nd --accept=iso http://example.com/centos-5/i386/与上一条命令相似，但多加了一个 --accept=iso 选项，这指示Linux wget仅下载 i386 目录中所有扩展名为 iso 的文件。你也可以指定多个扩展名，只需用逗号分隔即可。

复制代码代码如下:$ wget -i filename.txt此命令常用于批量下载的情形，把所有需要下载文件的地址放到 filename.txt 中，然后 Linux wget就会自动为你下载所有文件了。

复制代码代码如下:$ wget -c http://example.com/really-big-file.iso这里所指定的 -c 选项的作用为断点续传。

复制代码代码如下:$ wget -m -k (-H) http://www.example.com/该命令可用来镜像一个网站，Linux wget将对链接进行转换。如果网站中的图像是放在另外的站点，那么可以使用 -H 选项。

三、参数

代码:

复制代码代码如下:$ wget --helpGNU Wget 1.9.1，非交互式的网络文件下载工具。用法：Linux wget[选项]... [URL]...长选项必须用的参数在使用短选项时也是必须的。

启动：

-V, --version 显示 Wget 的版本并且退出。
-h, --help 打印此帮助。
-b, -background 启动后进入后台操作。
-e, -execute=COMMAND 运行‘.wgetrc’形式的命令。
日志记录及输入文件：

-o, --output-file=文件将日志消息写入到指定文件中。
-a, --append-output=文件将日志消息追加到指定文件的末端。
-d, --debug 打印调试输出。
-q, --quiet 安静模式(不输出信息)。
-v, --verbose 详细输出模式(默认)。
-nv, --non-verbose 关闭详细输出模式，但不进入安静模式。
-i, --input-file=文件下载从指定文件中找到的 URL。
-F, --force-html 以 HTML 方式处理输入文件。
-B, --base=URL 使用 -F -i 文件选项时，在相对链接前添加指定的 URL。
下载：

-t, --tries=次数配置重试次数（0 表示无限）。
--retry-connrefused 即使拒绝连接也重试。
-O --output-document=文件将数据写入此文件中。
-nc, --no-clobber 不更改已经存在的文件，也不使用在文件名后添加 .#（# 为数字）的方法写入新的文件。
-c, --continue 继续接收已下载了一部分的文件。
--progress=方式选择下载进度的表示方式。
-N, --timestamping 除非远程文件较新，否则不再取回。
-S, --server-response 显示服务器回应消息。
--spider 不下载任何数据。
-T, --timeout=秒数配置读取数据的超时时间 (秒数)。
-w, --wait=秒数接收不同文件之间等待的秒数。
--waitretry=秒数在每次重试之间稍等一段时间 (由 1 秒至指定的秒数不等)。
--random-wait 接收不同文件之间稍等一段时间(由 0 秒至 2*WAIT 秒不等)。
-Y, --proxy=on/off 打开或关闭代理服务器。
-Q, --quota=大小配置接收数据的限额大小。
--bind-address=地址使用本机的指定地址 (主机名称或 IP) 进行连接。
--limit-rate=速率限制下载的速率。
--dns-cache=off 禁止查找存于高速缓存中的 DNS。
--restrict-file-names=OS 限制文件名中的字符为指定的 OS (操作系统) 所允许的字符。
目录：

-nd --no-directories 不创建目录。
-x, --force-directories 强制创建目录。
-nH, --no-host-directories 不创建含有远程主机名称的目录。
-P, --directory-prefix=名称保存文件前先创建指定名称的目录。
--cut-dirs=数目忽略远程目录中指定数目的目录层。
HTTP 选项：

--http-user=用户配置 http 用户名。
--http-passwd=密码配置 http 用户密码。
-C, --cache=on/off (不)使用服务器中的高速缓存中的数据 (默认是使用的)。
-E, --html-extension 将所有 MIME 类型为 text/html 的文件都加上 .html 扩展文件名。
--ignore-length 忽略“Content-Length”文件头字段。
--header=字符串在文件头中添加指定字符串。
--proxy-user=用户配置代理服务器用户名。
--proxy-passwd=密码配置代理服务器用户密码。
--referer=URL 在 HTTP 请求中包含“Referer：URL”头。
-s, --save-headers 将 HTTP 头存入文件。
-U, --user-agent=AGENT 标志为 AGENT 而不是 Wget/VERSION。
--no-http-keep-alive 禁用 HTTP keep-alive（持久性连接）。
--cookies=off 禁用 cookie。
--load-cookies=文件会话开始前由指定文件载入 cookie。
--save-cookies=文件会话结束后将 cookie 保存至指定文件。
--post-data=字符串使用 POST 方法，发送指定字符串。
--post-file=文件使用 POST 方法，发送指定文件中的内容。
HTTPS (SSL) 选项：

--sslcertfile=文件可选的客户段端证书。
--sslcertkey=密钥文件对此证书可选的“密钥文件”。
--egd-file=文件 EGD socket 文件名。
--sslcadir=目录 CA 散列表所在的目录。
--sslcafile=文件包含 CA 的文件。
--sslcerttype=0/1 Client-Cert 类型 0=PEM (默认) / 1=ASN1 (DER)
--sslcheckcert=0/1 根据提供的 CA 检查服务器的证书
--sslprotocol=0-3 选择 SSL 协议；0=自动选择，
1=SSLv2 2=SSLv3 3=TLSv1
FTP 选项：

-nr, --dont-remove-listing 不删除“.listing”文件。
-g, --glob=on/off 设置是否展开有通配符的文件名。
--passive-ftp 使用“被动”传输模式。
--retr-symlinks 在递归模式中，下载链接所指示的文件(连至目录则例外）。
递归下载：

-r, --recursive 递归下载。
-l, --level=数字最大递归深度(inf 或 0 表示无限)。
--delete-after 删除下载后的文件。
-k, --convert-links 将绝对链接转换为相对链接。
-K, --backup-converted 转换文件 X 前先将其备份为 X.orig。
-m, --mirror 等效于 -r -N -l inf -nr 的选项。
-p, --page-requisites 下载所有显示完整网页所需的文件，例如图像。
--strict-comments 打开对 HTML 备注的严格(SGML)处理选项。
递归下载时有关接受/拒绝的选项：

-A, --accept=列表接受的文件样式列表，以逗号分隔。
-R, --reject=列表排除的文件样式列表，以逗号分隔。
-D, --domains=列表接受的域列表，以逗号分隔。
--exclude-domains=列表排除的域列表，以逗号分隔。
--follow-ftp 跟随 HTML 文件中的 FTP 链接。
--follow-tags=列表要跟随的 HTML 标记，以逗号分隔。
-G, --ignore-tags=列表要忽略的 HTML 标记，以逗号分隔。
-H, --span-hosts 递归时可进入其它主机。
-L, --relative 只跟随相对链接。
-I, --include-directories=列表要下载的目录列表。
-X, --exclude-directories=列表要排除的目录列表。
-np, --no-parent 不搜索上层目录。

四、实例：用Wget批量下载远程FTP服务器上的文件
昨天买了个VPS，把虚拟主机迁移到VPS了，迁移过程肯定是要转移数据的。以前虚拟主机迁移数据的模式是非常低效率的，旧主机打包下载->新主机上传再解压缩，由于家庭网络带宽非常低，而且ADSL的上行速率512kbps万年不变，导致以前迁移网站绝对是体力活...

现在有了VPS，有了shell，这个过程就无比简单了，借助机房的大带宽，直接机房对机房互传文件看着简直就是一种享受啊

好了，讲一下方法：

1、旧虚拟主机打包备份整站 site.tar.gz

2、在VPS的shell中利用wget下载旧虚拟主机中的site.tar.gz，使用FTP协议

复制代码代码如下:
wget --ftp-user=username --ftp-password=password -m -nh ftp://xxx.xxx.xxx.xxx/xxx/xxx/site.tar.gz
wget --ftp-user=username --ftp-password=password -r -m -nh ftp://xxx.xxx.xxx.xxx/xxx/xxx/*

上面就是命令了，FTP用户名密码参数不解释；

-r 可选，表示递归下载，如果直接下载整个目录就需要该参数；

-m 表示镜像，不解释；

-nh表示不生成那一堆层级目录，直接从当前目录开始显示，非常好的参数；

后面是ftp的地址，斜杠后的 * 表示下载该目录下的所有文件，如果只是一个文件，直接输入文件名即可。

五、Q&A

A.使用wget工具linux所以的主要版本都自带了Linux wget这个下载工具.bash$ wget http://place.your.url/here它还能控制ftp来下载整个web站点的各级目录,当然,如果你不小心,可能会把整个网站以及其他和他做链接的网站全部下载下来.bash$ wget -m http://target.web.site/subdirectory由于这个工具具有很强的下载能力,所以可以在服务器上把它用作镜像网站的工具.让它按照”robots.txt”的规定来执行.有很多参数用来控制它如何正确地做镜像,可以限制链接的类型和下载文件的类型等等.例如:只下载有联系的链接并且忽略GIF图片:

复制代码代码如下:bash$ wget -m -L –reject=gif http://target.web.site/subdirectory

Linux wget也能够实现断点续传(-c参数),当然,这种操作是需要远程服务器支持的.

复制代码代码如下:bash$ wget -c http://the.url.of/incomplete/file可以把断点续传和镜像功能结合起来,这样可以在以前断过多次的情况下继续镜像一个有大量选择性文件的站点.如何自动实现这个目的我们在后面会讨论得更多.

如果你觉得下载时老是断线会影响你办公的话,你可以限制Linux wget重试的次数.

复制代码代码如下:bash$ wget -t 5 http://place.your.url/here这样重试五次后就放弃了.用”-t inf”参数表示永远不放弃.不停地重试.

B．那对于代理服务该怎么办呢?可以使用http代理的参数或者在.wgetrc配置文件里指定一个如何通过代理去下载的途径.但是有这么一个问题,如果通过代理来进行断点续传的话可能会有几次失败.如果有一次通过代理下载的过程发生中断,那么代理服务器上缓存里保存是那个完整的文件拷贝. 所以当你用”wget -c”来下载剩余部分的时候代理服务器查看它的缓存,并错误地认为你已经下载了整个文件.于是就发出了错误的信号.这个时候你可以用添加一个特定的请求参数来促使代理服务器清除他们的缓存:

复制代码代码如下:bash$ wget -c –header=”Pragma: no-cache” http://place.your.url/here

这个”–header”参数能够以各种数字，各种方式添加。通过它我们可以更改web服务器或者代理服务器的某些属性。有些站点不提供外部连接的文件服务，只有通过同一个站点上其他的一些页面时内容才会被提交。这个时候你可以用加上”Referer:”参数：bash$ wget –header=”Referer: http://coming.from.this/page” http://surfing.to.this/page有些特殊的网站只支持某种特定的浏览器，这个时候可以用”User-Agent:”参数

复制代码代码如下:bash$ wget –header=”User-Agent: Mozilla/4.0 (compatible; MSIE 5.0;Windows NT; DigExt)” http://msie.only.url/here

C．那我怎么设定下载时间呢？
如果你需要在你的办公电脑上通过和其他同事共享的一个连接来下载一些很大的文件，而且你希望你的同事不会因为网络速度的减慢而收到影响，那你就应该尽量避开高峰时段。当然,不需要在办公室里等到所以人都走掉，也不需要在家里用完晚饭后还惦记着要上网下载一次。用at来就可以很好的定制工作时间：bash$ at 23：00warning: commands will be executed using /bin/shat> wget http://place.your.url/hereat> press Ctrl-D这样，我们设定了下载工作在晚上11点进行。为了使这个安排能够正常进行，请确认atd这个后台程序正在运行。

D．下载要花很多时间？
当你需要下载大量的数据，而且你又没有享有足够的带宽,这个时候你会经常发现在你安排的下载任务还没有完成，一天的工作却又要开始了。
作为一个好同事，你只能停掉了这些任务，而开始另外的工作。然后你又需要反复地重复使用”wget -c”来完成你的下载。这样肯定太繁琐了，所以最好是用crontab来自动执行。创建一个纯文本文件，叫做”crontab.txt”,包含下面的内容：0 23 * * 1-5 wget -c -N http://place.your.url/here0 6 * * 1-5 killall wgetz这个crontab文件指定某些任务定期地执行。前五列声明是什么时候执行这个命令，而每行的剩余部分则告诉crontab执行什么内容。

前两列指定了每天一到晚上11点就开始用Linux wget下载，一到早上6点就停止一切Linux wget下载。第三四列的*表示每个月的每一天都执行这个任务。第五列则指定了一个星期的哪几天来执行这个程序。 –”1-5″表示从星期一到星期五。这样在每个工作日的晚上11点，下载工作开始，到了上午的6点，任何的Linux wget任务就被停掉了。你可以用下面的命令来执行

复制代码代码如下:crontab：bash$ crontab crontab.txt

Linux wget的这个”-N”参数将会检查目标文件的时间戳，如果匹配了，下载程序就会停止，因为它说明整个文件已经下载完全了。用”crontab -r”可以删除这个计划安排。我已经多次采用这种方法，通过共享的电话拨号来下载过很多的ISO镜像文件,还是比较实用的。

E．如何下载动态变化的网页
有些网页每天都要根据要求变化好几次.所以从技术上讲,目标不再是一个文件,它没有文件长度.因此”-c”这个参数也就失去了意义.例如:一个php写的并且经常变动的linux周末新闻网页:

复制代码代码如下:bash$ wget http://lwn.net/bigpage.php3

我办公室里的网络条件经常很差,给我的下载带了很大的麻烦,所以我写了个简单的脚本来检测动态页面是否已经完全更新了.

复制代码代码如下:
#!/bin/bash
#create it if absent
touch bigpage.php3
#check if we got the whole thing
while ! grep -qi bigpage.php3
do
rm -f bigpage.php3
#download LWN in one big page
wget http://lwn.net/bigpage.php3
done
这个脚本能够保证持续的下载该网页,直到网页里面出现了" ",这就表示该文件已经完全更新了.

F．对于ssl和Cookies怎么办？
如果你要通过ssl来上网,那么网站地址应该是以”https://”来开头的.在这样的情况下你就需要另外一种下载工具,叫做curl，它能够很容易获得.有些网站迫使网友在浏览的时候必须使用cookie.所以你必须从在网站上得到的那个 Cookie里面得到”Cookie:”这个参数.这样才能保证下载的参数正确.对于lynx和Mozilla的Cookie的文件格式,用下面的:

复制代码代码如下:bash$ cookie=$( grep nytimes ~/.lynx_cookies |awk {printf(”%s=%s;”,$6,$7)} )就可以构造一个请求Cookie来下载http://www.nytimes.com上的内容.当然,你要已经用这个浏览器在该网站上完成注册.w3m使用了一种不同的,更小巧的Cookie文件格式:
复制代码代码如下:bash$ cookie=$( grep nytimes ~/.w3m/cookie |awk {printf(”%s=%s;”,$2,$3)} )
现在就可以用这种方法来下载了:
复制代码代码如下:bash$ wget –header=”Cookie: $cookie” http://www.nytimes.com/reuters/technology/tech-tech-supercomput.html
或者用curl工具:
复制代码代码如下:bash$ curl -v -b $cookie -o supercomp.html http://www.nytimes.com/reuters/technology/tech-tech-supercomput.htm

G．如何建立地址列表？
到现在为止我们下载的都是单个文件或者是整个网站.有的时候我们需要下载某个网页上链接的大量文件,但没有必要把它整个网站都镜像下来.比如说我们想从一个依次排列的100首歌里面下载前20首.注意,这里”–accept”和”–reject”参数是不会起作用的, 因为他们只对文件操作起作用.所以一定要用”lynx -mp”参数来代替.

复制代码代码如下:bash$ lynx -mp ftp://ftp.ssc.com/pub/lg/ |grep gz$ |tail -10 |awk {print $2} > urllist.txt
lynx的输出结果可以被各种GNU文本处理工具过虑.在上面的例子里,我们的链接地址是以”gz”结尾的,并且把最后10个文件地址放到urllist.txt文件里.然后我们可以写一个简单的bash脚本来自动下载这个文件里的目标文件:

复制代码代码如下:
bash$ for x in $(cat urllist.txt)
> do
> wget $x
> done
这样我们就能够成功下载Linux Gazette网站(ftp://ftp.ssc.com/pub/lg/)上的最新10个论题.

H．扩大使用的带宽
如果你选择下载一个受带宽限制的文件,那你的下载会因为服务器端的限制而变得很慢.下面这个技巧会大大缩短下载的过程.但这个技巧需要你使用curl并且远程服务器有多个镜像可以供你下载.例如,假设你想从下面的三个地址下载Mandrake 8.0:

复制代码代码如下:
url1=http://ftp.eecs.umich.e/pub/linux/mandrake/iso/Mandrake80-inst.iso
url2=http://ftp.rpmfind.net/linux/Mandrake/iso/Mandrake80-inst.iso
url3=http://ftp.wayne.e/linux/mandrake/iso/Mandrake80-inst.iso
这个文件的长度是677281792个字节,所以用curl程序加”–range”参数来建立三个同时进行的下载:

复制代码代码如下:
bash$ curl -r 0-199999999 -o mdk-iso.part1 $url1 &
bash$ curl -r 200000000-399999999 -o mdk-iso.part2 $url2 &
bash$ curl -r 400000000- -o mdk-iso.part3 $url3 &
这样就创建了三个后台进程.每个进程从不同的服务器传输这个ISO文件的不同部分.这个”-r”参数指定目标文件的字节范围.当这三个
进程结束后,用一个简单的cat命令来把这三个文件衔接起来– cat mdk-iso.part? > mdk-80.iso.(强烈建议在刻盘之前先检查md5)
你也可以用”–verbose”参数来使每个curl进程都有自己的窗口来显示传输的过程.

Ⅳ Linux下wget命令详解

Linux系统中，wget命令是一个强大的命令行工具，专为从Web获取文件而设计，支持HTTP、HTTPS和FTP协议。它的功能丰富，包括下载单个或多个文件、后台下载、断点续传，以及对下载速度、目录、模拟浏览器和重试次数的控制等。下面来逐一了解这些常用选项。

下载文件时，使用-wget [选项] url，例如下载redis的tar.gz文件，会实时显示下载进度和文件信息。通过-O选项，可以指定下载后文件的名称，如wget -O custom_name url。

-P选项允许你将文件下载到指定的目录，如wget -P /usr/software url，这样文件会直接保存在指定路径。

如果你的下载中断，可以使用-c选项恢复下载，让下载从上次断点继续，避免从头开始。另外，-b选项可以实现下载过程的后台运行，便于你进行其他操作。

下载多个文件时，可以创建包含所有URL的文本文件，然后使用-i选项指定该文件。同时，--limit-rate选项可用于设置下载速度，以避免带宽占用过多。

如果遇到服务器权限问题，可以使用-U选项模拟浏览器下载，如wget -U 'Mozilla/5.0' url。对于网络不稳定或大文件下载可能失败的情况，-tries选项可以增加重试次数，比如wget --tries 50 url。

对于受密码保护的FTP下载，需要使用如wget -u username -p password ftp_url的格式。wget的强大功能远不止这些，灵活的选项让它在各种下载场景下都能得心应手。

导航:首页 > 程序命令 > linux命令如何重试几次

linux命令如何重试几次

与linux命令如何重试几次相关的资料