網路爬蟲---從千圖網爬取圖片到本地

Emilyzhai發表於2019-09-03

#圖片爬蟲,從千圖網爬取圖片到本地
import urllib.request
import re
import urllib.error
for i in range(1,10):
    pageurl = "https://www.58pic.com/piccate/11-200-0-p"+str(i)+".html"
    data = urllib.request.urlopen(pageurl).read().decode('utf-8','ignore')
    pat = '<div class="card-trait">.*?src="(.*?)\.jpg!'
    imglist = re.compile(pat).findall(data)
    for j in range(0,len(imglist)):
        try:
            thisimg = imglist[j]
            thisimgurl = "http:"+thisimg+".jpg!w1024_new_0"
            file = "D:/24/"+str(i)+str(j)+".jpg"
            urllib.request.urlretrieve(thisimgurl,filename=file)
            print("第"+str(i)+"頁第"+str(j)+"個圖片爬取成功")
        except urllib.error.URLError as e:
            if hasattr(e,'code'):
                print(e.code)
            if hasattr(e,'reason'):
                print(e.reason)
        except Exception as e:
            print("異常")

相關文章