wget使用proxy的配置

bulletming發表於2019-03-12
 在~/.wgetrc中設定代理
http_proxy =
ftp_proxy =
use_proxy = on
wait = 15

然後直接wget 就ok了

======================================
紅色很重要(轉自http://realchecko.blogspot.com/2007/05/wget.html)

5.31.2007

wget : 抓取某個目錄

使用 " -r " 引數,wget 會到處去抓,包括 上層目錄。
如果只要抓某個目錄就是加上 "-L" 引數。
 wget -r -L /
將prebuild cross toolchain 抓下來。
還是有不一樣的地方 .. 每個folde會多一個 index.html。

==============================================================
方便的網路下載工具wget

wget是一個強力方便的命令列方式下的下載工具。本文介紹了wget的基本用法。

網路使用者有時候會遇到需要下載一批檔案的情況,有時甚至需要把整個網站下載下來或者製作網站的映象。在Windows下的使用者都比較熟悉
Teleport,webzip等等網站下載工具,實際上AIX中也完全可以做到這樣的功能,那就是利用wget工具。wget是一個命令列工具,用來下
載網路檔案或者整個網站,它具有自動重試、斷點續傳、支援代理伺服器等等強大的功能。它可以完全替代ftp客戶端。wget是在Linux下開發的開放源
程式碼的軟體,作者是Hrvoje Niksic,後來被移植到包括Windows在內的各個平臺上。IBM在AIX Linux
Toolbox中也提供了這個工具,使得它可以在AIX下執行。您可以在IBM網站
/products/aixos/linux/altlic.html下載到它。IBM提供的wget是1.8.1版本,rpm包格式的。

wget雖然功能強大,但是使用起來還是比較簡單的,基本的語法是:wget [引數列表] URL。下面就結合具體的例子來說明一下wget的用法。

1、下載整個http或者ftp站點。

wget

這個命令可以將 首頁下載下來。使用-x會強制建立伺服器上一模一樣的目錄,如果使用-nd引數,那麼伺服器上下載的所有內容都會加到本地當前目錄。

wget -r

這個命令會按照遞迴的方法,下載伺服器上所有的目錄和檔案,實質就是下載整個網站。這個命令一定要小心使用,因為在下載的時候,被下載網站指向的所有地址
同樣會被下載,因此,如果這個網站引用了其他網站,那麼被引用的網站也會被下載下來!基於這個原因,這個引數不常用。可以用-l
number引數來指定下載的層次。例如只下載兩層,那麼使用-l 2。

要是您想製作映象站點,那麼可以使用-m引數,例如:

wget -m

這時wget會自動判斷合適的引數來製作映象站點。此時,wget會登入到伺服器上,讀入robots.txt並按robots.txt的規定來執行。

2、斷點續傳。

當檔案特別大或者網路特別慢的時候,往往一個檔案還沒有下載完,連線就已經被切斷,此時就需要斷點續傳。wget的斷點續傳是自動的,只需要使用-c引數,例如:

wget -c

使用斷點續傳要求伺服器支援斷點續傳。-t參數列示重試次數,例如需要重試100次,那麼就寫-t 100,如果設成-t 0,那麼表示無窮次重試,直到連線成功。-T參數列示超時等待時間,例如-T 120,表示等待120秒連線不上就算超時。

3、批次下載。

如果有多個檔案需要下載,那麼可以生成一個檔案,把每個檔案的URL寫一行,例如生成檔案download.txt,

然後用命令:

wget -i download.txt

這樣就會把download.txt裡面列出的每個URL都下載下來。(如果列的是檔案就下載檔案,如果列的是網站,那麼下載首頁)

4、選擇性的下載。

可以指定讓wget只下載一類檔案,或者不下載什麼檔案。例如:

wget -m --reject=gif

表示下載,但是忽略gif檔案。--accept=LIST 可以接受的檔案型別,--reject=LIST拒絕接受的檔案型別。

5、密碼和認證。

wget只能處理利用使用者名稱/密碼方式限制訪問的網站,可以利用兩個引數:

--http-user=USER設定HTTP使用者

--http-passwd=PASS設定HTTP密碼

對於需要證書做認證的網站,就只能利用其他下載工具了,例如curl。

6、利用代理伺服器進行下載。

如果使用者的網路需要經過代理伺服器,那麼可以讓wget透過代理伺服器進行檔案的下載。此時需要在當前使用者的目錄下建立一個.wgetrc檔案。檔案中可以設定代理伺服器:

http-proxy = 111.111.111.111:8080

ftp-proxy = 111.111.111.111:8080

分別表示http的代理伺服器和ftp的代理伺服器。如果代理伺服器需要密碼則使用:

--proxy-user=USER設定代理使用者

--proxy-passwd=PASS設定代理密碼

這兩個引數。

使用引數--proxy=on/off 使用或者關閉代理。

wget還有很多有用的功能,需要使用者去挖掘。

備註:wget是免費軟體,IBM公司不對wget提供軟體維護和技術支援。


本文來自ChinaUnix部落格,如果檢視原文請點:http://blog.chinaunix.net/u/13662/showart_376650.html

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/82392/viewspace-448835/,如需轉載,請註明出處,否則將追究法律責任。

相關文章