圖片爬取實戰一

xie仗劍天涯發表於2017-06-14

簡介：爬取京東商城手機類商品圖片

思路：
1. 獲取需要爬取手機商品內容的url,
開啟京東商城首頁 -- 手機/營運商/數碼 -- 手機。獲得URL為：https://list.jd.com/list.html?cat=9987,653,655

2. 檢視URL變化過程
單擊下一頁，檢視商品的URL變化情況
點選第二頁：URL為：https://list.jd.com/list.html?cat=9987,653,655&page=2&sort=sort_rank_asc&trans=1&JL=6_0_0&ms=5#J_main
點選第三頁：URL為：https://list.jd.com/list.html?cat=9987,653,655&page=3&sort=sort_rank_asc&trans=1&JL=6_0_0#J_main
......
在這GET的請求中可以發現，關鍵資訊為$page的欄位資訊，page的值代表者第幾頁
所以，可以在爬取過程中使用 for 迴圈實現頁面的切換

3. 檢視圖片的網頁資訊
F12 檢視圖片的資訊，可以發現圖片對應的連結程式碼是：
<img width="220" height="220" data-img="1" src="//img14.360buyimg.com/n7/jfs/t5068/191/1900595808/365322/635c9e26/58f5c5e0Nb72bc1d3.jpg"

4. 下載儲存圖片
使用urllib.urlreieve()將對應連結的圖片儲存到本地

指令碼程式碼如下：

import re
import urllib
import urllib2


def JD_picture(url, page):
    html1 = urllib2.urlopen(url).read()
    html1 = str(html1)


    pat2 = '<img width="220" height="220" data-img="1" src="//(.+?\.jpg)">'
    imagelist = re.compile(pat2).findall(html1)

    x = 1
    for imageurl in imagelist:
        imagename = str(page) + str(x) + ".jpg"
        imageurl = "http://" + imageurl

        try:
            urllib.urlretrieve(imageurl, filename="C:\PyCharm\Crawl_Photo\jingdong")
        except urllib2.URLError as e:
            if hasattr(e, "code"):
                x += 1
            if hasattr(e, "reason"):
                x += 1
        x += 1


for i in range(1, 20):
    url = 'https://list.jd.com/list.html?cat=9987,653,655&page=' + str(i)
    JD_picture(url,i)

Python爬蟲實戰詳解：爬取圖片之家
2020-11-04
Python爬蟲
Python3 大型網路爬蟲實戰 003 — scrapy 大型靜態圖片網站爬蟲專案實戰 — 實戰：爬取 169美女圖片網高清圖片
2016-12-26
Python爬蟲網站
Java爬蟲批量爬取圖片
2021-09-24
Java爬蟲
node：爬蟲爬取網頁圖片
2019-02-16
爬蟲網頁
爬蟲---xpath解析（爬取美女圖片）
2020-12-23
爬蟲
爬取微博圖片資料存到Mysql中遇到的各種坑mysql儲存圖片爬取微博圖片
2019-02-16
MySql
爬蟲實戰（一）：爬取微博使用者資訊
2018-07-15
爬蟲
爬蟲 Scrapy框架爬取圖蟲圖片並下載
2018-08-27
爬蟲框架
Python爬蟲—爬取某網站圖片
2020-11-19
Python爬蟲網站
網路爬蟲---從千圖網爬取圖片到本地
2019-09-03
爬蟲
Python爬蟲入門【5】：27270圖片爬取
2019-07-30
Python爬蟲
Python爬蟲學習（6）: 爬取MM圖片
2016-10-21
Python爬蟲
教你如何快速實現一個圖片爬蟲
2017-09-22
爬蟲
ReactPHP 爬蟲實戰：下載整個網站的圖片
2019-01-20
ReactPHP爬蟲網站
Python爬蟲新手教程：知乎文章圖片爬取器
2019-07-20
Python爬蟲
Python爬蟲入門-爬取pexels高清圖片
2017-09-24
Python爬蟲
Python爬蟲實戰-使用Scrapy框架爬取土巴兔(一)
2017-03-18
Python爬蟲框架
新手爬蟲教程：Python爬取知乎文章中的圖片
2019-01-17
爬蟲Python
蘇寧易購網址爬蟲爬取商品資訊及圖片
2021-10-12
爬蟲
Python爬蟲遞迴呼叫爬取動漫美女圖片
2020-10-19
Python爬蟲遞迴
Python 爬蟲入門 (二) 使用Requests來爬取圖片
2017-02-24
Python爬蟲
go語言實現簡單爬蟲獲取頁面圖片
2022-11-14
Go爬蟲
爬蟲實戰——58同城租房資料爬取
2019-12-04
爬蟲
Python《必應bing桌面圖片爬取》
2020-12-26
Python
python3爬取1024圖片
2016-10-30
Python
python 爬蟲之requests爬取頁面圖片的url，並將圖片下載到本地
2019-06-12
Python爬蟲
簡單的爬蟲：爬取網站內容正文與圖片
2021-09-09
爬蟲網站
實用爬蟲-03-爬取視訊教程課程名+連結+下載圖片
2018-10-29
爬蟲
Python爬蟲實戰：爬取淘寶的商品資訊
2021-09-11
Python爬蟲
爬蟲怎麼根據一個關鍵詞爬取上千張網路圖片
2018-01-25
爬蟲
Python爬蟲——實戰一：爬取京東產品價格(逆向工程方法)
2017-08-15
Python爬蟲
網路爬蟲——爬蟲實戰（一）
2022-01-29
爬蟲
使用Scrapy爬取圖片入庫,並儲存在本地
2019-06-27
java 爬取網頁內容。標題、圖片等
2021-09-24
Java網頁
Python應用開發——爬取網頁圖片
2022-09-21
Python網頁
Python爬取微博資料生成詞雲圖片
2017-08-29
Python
Python爬蟲入門【4】：美空網未登入圖片爬取
2019-07-30
Python爬蟲
Python網路爬蟲2 - 爬取新浪微博使用者圖片
2018-04-10
Python爬蟲

圖片爬取實戰一

相關文章