WGET——LINUX下WEB檔案提取工具(轉)
wget——Linux下Web檔案提取工具(轉)[@more@]wget是一個Linux環境下用於從World Wide Web上提取檔案的工具,這是一個GPL許可證下的自由軟體,其作者為Hrvoje Niksic 。wget支援HTTP和FTP協議,支援代理伺服器和斷點續傳功能,能夠自動遞迴遠端主機的目錄,找到合乎條件的檔案並將其下載到本地硬碟上;如果必要,wget將恰當地轉換頁面中的超級連線以在本地生成可瀏覽的映象。由於沒有互動式介面,wget可在後臺執行,截獲並忽略HANGUP訊號,因此在使用者推出登入以後,仍可繼續執行。通常,wget用於成批次地下載Internet網站上的檔案,或製作遠端網站的映象。語法:wget [options] [URL-list]URL地址格式說明:可以使用如下格式的URL:[:port]/path例如:ftp://ftp.xemacs.org/pub/xemacs/xemacs-19.14.tar.gzftp://username:password@host/dir/file 在最後一種形式中,以URL編碼形式為FTP主機提供了使用者名稱和密碼(當然,也可以使用引數提供該資訊,見後)。引數說明:wget的引數較多,但大部分應用只需要如下幾個常用的引數:-r 遞迴;對於HTTP主機,wget首先下載URL指定的檔案,然後(如果該檔案是一個HTML文件的話)遞迴下載該檔案所引用(超級連線)的所有檔案(遞迴深度由引數-l指定)。對FTP主機,該引數意味著要下載URL指定的目錄中的所有檔案,遞迴方法與HTTP主機類似。-N 時間戳:該引數指定wget只下載更新的檔案,也就是說,與本地目錄中的對應檔案的長度和最後修改日期一樣的檔案將不被下載。-m 映象:相當於同時使用-r和-N引數。-l 設定遞迴級數;預設為5。-l1相當於不遞迴;-l0為無窮遞迴;注意,當遞歸深度增加時,檔案數量將呈指數級增長。-t 設定重試次數。當連線中斷(或超時)時,wget將試圖重新連線。如果指定-t0,則重試次數設為無窮多。-c 指定斷點續傳功能。實際上,wget預設具有斷點續傳功能,只有當你使用別的ftp工具下載了某一檔案的一部分,並希望wget接著完成此工作的時候,才需要指定此引數。使用舉例:wget -m -l4 -t0 將在本地硬碟建立的映象,映象檔案存入當前目錄下一個名為oneweb.com.cn的子目錄中(你也可以使用-nH引數指定不建立該子目錄,而直接在當前目錄下建立映象的目錄結構),遞迴深度為4,重試次數為無窮(若連線出現問題,wget將堅韌不拔地永遠重試下去,知道任務完成!)另外一些使用頻率稍低的引數如下:-A acclist / -R rejlist:這兩個引數用於指定wget接受或排除的副檔名,多個名稱之間用逗號隔開。例如,假設我們不想下載MPEG影片影像檔案和.AU聲音檔案,可使用如下引數:-R mpg,mpeg,au其它引數還有:-L 只擴充套件相對連線,該引數對於抓取指定站點很有用,可以避免向宿主主機的其他目錄擴散。例如,某個人網站地址為:~ppfl/,使用如下命令列:wget -L ~ppfl/則只提取該個人網站,而不涉及主機上的其他目錄。-k 轉換連線:HTML檔案存檔時,將其中的非相對連線轉換成為相對連線。-X 在下載FTP主機上的檔案時,排除若干指定的目錄另外,下面引數用於設定wget的工作介面:-v 設定wget輸出詳細的工作資訊。-q 設定wget不輸出任何資訊。如果我們已經在一個HTML文件(或普通文字文件)中儲存了所要提取的檔案的連線,可以讓wget直接從該檔案中提取資訊,而不用在命令列中提供URL地址,引數格式為:-i filename地址檔案也可以不是HTML文件,例如,一個普通的文字檔案,其中有需要下載的URL列表即可。我們可以用以下技巧提高下載速度:由於Linux是一個多工系統,我們可以同時執行多個wget程式以提高下載速度,例如,先下載某主頁檔案(index.html),然後將該檔案所列出的所有地址分別用一個獨立的wget程式進行下載。至於其他的引數,可參考wget的man手冊頁,命令為:man wget
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/8225414/viewspace-938606/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Linux基礎命令---wget下載工具Linuxwget
- Linux下把sra檔案轉成fastq檔案LinuxAST
- File Juicer for Mac(檔案提取工具)UIMac
- File Juicer mac 4.99 中文版 檔案提取工具UIMac
- Mac系統下檔案編碼轉換工具encaMac
- 如何進行Linux下檔案編碼格式轉換Linux
- transfer 全平臺Windows linux mac配置檔案轉換工具WindowsLinuxMac
- !!!提取檔案記錄!!!
- Linux下玩轉nginx系列(二)——nginx配置檔案說明LinuxNginx
- Linux下合併檔案Linux
- Linux 檔案同步工具之 rsyncLinux
- 製作ISO檔案 與 提取ISO檔案
- Linux常用網路傳輸工具命令,ssh、curl、wget、scpLinuxwget
- day58:Linux:BashShell&linux檔案管理&linux檔案下載上傳Linux
- 轉換Linux 檔案編碼方式Linux
- Linux與Windows共享檔案Samba(轉)LinuxWindowsSamba
- Linux檔案查詢工具的探索Linux
- Linux下安裝whl檔案Linux
- 從 ISO 映象中提取和複製檔案的絕招(Linux)Linux
- linux 下用 Wget 傳送 帶引數的請求Linuxwget
- 向web伺服器下載檔案Web伺服器
- Linux下玩轉nginx系列(三)---nginx日誌配置檔案說明LinuxNginx
- wget遞迴下載wget遞迴
- linux下使用windows標頭檔案LinuxWindows
- 推薦一個yaml檔案轉json檔案的線上工具YAMLJSON
- php檔案操作之提取檔案/目錄的名稱PHP
- vscode外掛:檔案樹提取器VSCode
- iWork Converter for Mac(iWork檔案批次轉換工具)Mac
- 在linux中使用 Pandoc 轉換檔案技巧Linux
- java 上傳 下載檔案工具類Java
- 檔案下載上傳小工具
- 檔案上傳下載小工具
- Linux 中 wget -c -t選項Linuxwget
- Linux 系統下解壓 rar 檔案Linux
- Linux下的檔案系統結構Linux
- Linux(RHEL) ISO映象檔案-下載地址Linux
- 【Linux】linux下刪除/清空資料夾/檔案命令Linux
- linux下oracle安裝檔案.cpio.gz檔案的解壓LinuxOracle
- 使用os.walk提取壓縮檔案並避免遞迴提取遞迴