利用Python爬取攝影網站圖片,切勿商用
今天我們繼續爬取一個網站,這個網站為 http://image.fengniao.com/ ,蜂鳥一個攝影大牛聚集的地方,本教程請用來學習,不要用於商業目的,不出意外,蜂鳥是有版權保護的網站。
Python學習資料或者需要程式碼、視訊加Python學習群:960410445
2. 網站分析
第一步,分析要爬取的網站有沒有方法爬取,開啟頁面,找分頁
http://image.fengniao.com/index.php?action=getList&class_id=192⊂_classid=0&page=1¬_in_id=5352384,5352410http://image.fengniao.com/index.php?action=getList&class_id=192⊂_classid=0&page=2¬_in_id=5352384,5352410http://image.fengniao.com/index.php?action=getList&class_id=192⊂_classid=0&page=3¬_in_id=5352384,5352410http://image.fengniao.com/index.php?action=getList&class_id=192⊂_classid=0&page=4¬_in_id=5352384,5352410
上面的頁面發現一個關鍵的引數 page=1 這個就是頁碼了,但是另一個比較頭疼的問題是,他沒有最後的頁碼,這樣我們沒有辦法確定迴圈次數,所以後面的程式碼編寫中,只能使用 while 了
這個地址返回的是JSON格式的資料,這個對爬蟲來說,非常友好!省的我們用正規表示式分析了。
分析這個頁面的標頭檔案,查閱是否有反爬措施
發現除了HOST和User-Agent以外,沒有特殊的點,大網站就是任性,沒啥反爬,可能壓根不在乎這個事情。
第二步,分析圖片詳情頁面,在我們上面獲取到的JSON中,找到關鍵地址
關鍵地址開啟之後,這個地方有一個比較騷的操作了,上面圖片中標註的URL選的不好,恰好是一個文章了,我們要的是組圖,重新提供一個新連結 http://image.fengniao.com/slide/535/5352130_1.html#p=1
開啟頁面,你可能直接去找規律了,找到下面的一堆連結,但是這個操作就有點複雜了,我們查閱上述頁面的原始碼
http://image.fengniao.com/slide/535/5352130_1.html#p=1http://image.fengniao.com/slide/535/5352130_1.html#p=2http://image.fengniao.com/slide/535/5352130_1.html#p=3....
網頁原始碼中發現了,這麼一塊區域
大膽的猜測一下,這個應該是圖片的JSON,只是他列印在了HTML中,我們只需要用正規表示式進行一下匹配就好了,匹配到之後,然後進行下載。
第三步,開始擼程式碼。
3. 寫程式碼
上面的連結已經生成,下面就是下載圖片了,也非常簡單
程式碼走起,結果
相關文章
- Python爬蟲—爬取某網站圖片Python爬蟲網站
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 爬蟲Selenium+PhantomJS爬取動態網站圖片資訊(Python)爬蟲JS網站Python
- 簡單的爬蟲:爬取網站內容正文與圖片爬蟲網站
- node:爬蟲爬取網頁圖片爬蟲網頁
- 利用Python爬蟲獲取招聘網站職位資訊Python爬蟲網站
- Python應用開發——爬取網頁圖片Python網頁
- python爬取網圖Python
- 利用python爬取城市公交站點Python
- Python3 大型網路爬蟲實戰 003 — scrapy 大型靜態圖片網站爬蟲專案實戰 — 實戰:爬取 169美女圖片網 高清圖片Python爬蟲網站
- 網路爬蟲---從千圖網爬取圖片到本地爬蟲
- Python爬蟲爬取美劇網站Python爬蟲網站
- Python爬蟲入門【4】:美空網未登入圖片爬取Python爬蟲
- Python網路爬蟲2 - 爬取新浪微博使用者圖片Python爬蟲
- Python爬蟲入門【5】:27270圖片爬取Python爬蟲
- Python爬蟲學習(6): 爬取MM圖片Python爬蟲
- Python爬蟲筆記(4):利用scrapy爬取豆瓣電影250Python爬蟲筆記
- 使用正則編寫簡單的爬蟲爬取某網站的圖片爬蟲網站
- Python爬蟲新手教程: 知乎文章圖片爬取器Python爬蟲
- Python爬蟲實戰詳解:爬取圖片之家Python爬蟲
- Python爬蟲入門-爬取pexels高清圖片Python爬蟲
- Python資料爬蟲學習筆記(11)爬取千圖網圖片資料Python爬蟲筆記
- Python 爬取網站資原始檔Python網站
- 使用 Python 爬取網站資料Python網站
- 聚焦婚紗攝影【京東互聯】婚紗攝影網站網站
- Java爬蟲批量爬取圖片Java爬蟲
- Python爬蟲之網頁圖片Python爬蟲網頁
- 用Python爬取圖片網站——基於BS4+多執行緒的處理Python網站執行緒
- 【python--爬蟲】千圖網高清背景圖片爬蟲Python爬蟲
- Python《必應bing桌面圖片爬取》Python
- python3爬取1024圖片Python
- 新手爬蟲教程:Python爬取知乎文章中的圖片爬蟲Python
- Python爬蟲遞迴呼叫爬取動漫美女圖片Python爬蟲遞迴
- Python 爬蟲入門 (二) 使用Requests來爬取圖片Python爬蟲
- Python爬蟲入門教程 2-100 妹子圖網站爬取Python爬蟲網站
- Python爬取電影天堂Python
- JB的Python之旅-爬取phizhub網站Python網站
- 爬蟲---xpath解析(爬取美女圖片)爬蟲