wget 網頁爬蟲,網頁抓取工具
前言
如何在linux上或者是mac上簡單使用爬蟲或者是網頁下載工具呢,常規的我們肯定是要去下載一個軟體下來使用啦,可憐的這兩個系統總是找不到相應的工具,這時wget出來幫助你啦!!!wget本身是拿來下載東西的,但遠不止那麼強大,是一把強大利器。
使用指南
- 快速上手(整個bootstrap網頁全被你抓取下來了~_~)
wget -c -r -npH -k http://v4.bootcss.com
- 1
-
引數說明
-c:斷點續傳
-r:遞迴下載
-np:遞迴下載時不搜尋上層目錄
-nd:遞迴下載時不建立一層一層的目錄,把所有檔案下載當前資料夾中
-p:下載網頁所需要的所有檔案(圖片,樣式,js檔案等)
-H:當遞迴時是轉到外部主機下載圖片或連結
-k:將絕對連結轉換為相對連結,這樣就可以在本地離線瀏覽網頁了
相關文章
- 爬蟲抓取網頁資料原理爬蟲網頁
- 爬蟲抓取網頁的詳細流程爬蟲網頁
- 《網頁爬蟲》網頁爬蟲
- 【爬蟲】網頁抓包工具--Fiddler爬蟲網頁
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- 如何讓Python爬蟲一天抓取100萬張網頁Python爬蟲網頁
- Python 爬蟲網頁內容提取工具xpath(二)Python爬蟲網頁
- 【爬蟲】網頁抓包工具--Charles的使用教程爬蟲網頁
- Python 爬蟲網頁內容提取工具xpath(一)Python爬蟲網頁
- Python 爬蟲網頁解析工具lxml.html(二)Python爬蟲網頁XMLHTML
- Python 爬蟲網頁解析工具lxml.html(一)Python爬蟲網頁XMLHTML
- 網頁爬蟲--未完成網頁爬蟲
- python 爬蟲網頁登陸Python爬蟲網頁
- node:爬蟲爬取網頁圖片爬蟲網頁
- 爬蟲進階——動態網頁Ajax資料抓取(簡易版)爬蟲網頁
- 如何用Python爬資料?(一)網頁抓取Python網頁
- 爬蟲,可用於增加訪問量和抓取網站全頁內容爬蟲網站
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- Python網路爬蟲抓取動態網頁並將資料存入資料庫MYSQLPython爬蟲網頁資料庫MySql
- 編寫web2.0爬蟲——頁面抓取部分Web爬蟲
- Java爬蟲系列二:使用HttpClient抓取頁面HTMLJava爬蟲HTTPclientHTML
- Jsoup + HtmlUtil 實現網易新聞網頁爬蟲JSHTML網頁爬蟲
- Node JS爬蟲:爬取瀑布流網頁高清圖JS爬蟲網頁
- NodeJS使用PhantomJs抓取網頁NodeJS網頁
- 騰牛網抓取(單頁)
- 如何抓取網頁資訊?網頁
- 網頁資料抓取之噹噹網網頁
- 001.01 一般網頁爬蟲處理網頁爬蟲
- python爬蟲:使用BeautifulSoup修改網頁內容Python爬蟲網頁
- 網路爬蟲之抓取郵箱爬蟲
- Python網路爬蟲之爬取淘寶網頁頁面 MOOC可以執行的程式碼Python爬蟲網頁
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- 手把手教你利用爬蟲爬網頁(Python程式碼)爬蟲網頁Python
- Python3 | 簡單爬蟲分析網頁元素Python爬蟲網頁
- Python靜態網頁爬蟲專案實戰Python網頁爬蟲
- 批量抓取網頁pdf檔案網頁
- 使用chromedriver抓取網頁截圖Chrome網頁
- 使用代理抓取網頁的原因網頁
- Python爬蟲二:抓取京東商品列表頁面資訊Python爬蟲