wget簡單使用

hopegrace發表於2013-02-24

wget是linux上的命令列的下載工具。支援HTTPFTP協議,支援代理伺服器和斷點續傳功能,能夠自動遞迴遠端主機的目錄,找到合乎條件的檔案並將其下載到本地硬碟上;如果必要,Linux wget將恰當地轉換頁面中的超級連線以在本地生成可瀏覽的映象。

基本用法:

wget -i $file -a out.log -O /dev/null -T 0.001-t 1

有些網站或者頁面,需要額外的認證,所以需要新增額外的HTTP Header,使用方法:

wget –header=”Host: www.google.comurl

通過–user-agent=來偽裝成瀏覽器

實現上傳資料:

wget –post-data=”user=user1&pass=pass1&submit=Login” http://domain.com/login.php

有些頁面的訪問需要登入,訪問的時候需要傳遞cookie,這時候就需要和上面提到的post方式結合。一般過程是:post使用者名稱和密碼登入、儲存cookie,然後訪問頁面時附帶上cookie

wget –post-data=”user=user1&pass=pass1&submit=Login” –save-cookies=cookie.txt –keep-session-cookies http://domain.com/login.php

wget –load-cookies=cookie.txt http://domain.com/path/page_need_login.php

Wget 與CURL的最大區別也是Wget的最大的優勢是可以進行遞迴的下載,可以一次下載一個HTML頁面 或者ftp列表中的所有內容。

原文:

[1]http://os.51cto.com/art/201002/183100.htm

[2]http://hi.baidu.com/hhflying/item/7ae51f3d30ce64fdde2221d9

wget和curl的區別

http://www.cnblogs.com/xuxm2007/archive/2010/09/07/1820963.html

[3]wget命令解釋

http://os.51cto.com/art/201002/183100.htm