python 爬蟲 mc 皮膚站 little skin 的簡單爬取

Coolest發表於2019-08-02

首先,找到一個皮膚網站,其中一個著名的皮膚網站就是https://littleskin.cn 。進入網站,我們就會見到一堆皮膚,這就是今天我們要爬的皮膚。給各位分享一下程式碼。

import requests
import re
import time
import json
download_sucess = True
time.sleep(1.5)
pictures = input('你想下載多少張皮膚:')
while pictures.isdigit() == False:
    print("請輸入數字!")
    pictures = input('你想下載多少張皮膚:')
Path = input('請輸入儲存的路徑:')
print("請稍等......")
pictures = int(pictures)
for i in range(1,pictures+1):
    url = 'https://littleskin.cn/skinlib/data?filter=skin&uploader=0&sort=likes&keyword=&page=' + str(i)
    response = requests.get(url).json()
    ids = re.findall("'tid': (.*?),",str(response))
    for id in ids:
        picture_url = 'https://littleskin.cn/preview/' + id + '.png'
    picture_name = picture_url.strip('https://littleskin.cn/preview/')
    picture = requests.get(picture_url).content
    try:
        with open(Path + '//%s'%picture_name,'wb') as file:
            file.write(picture)
    except FileNotFoundError:
        download_sucess = False
        print('路徑不存在!')
        break
if download_sucess == False:
    print("下載失敗!")
elif download_sucess == True:
    print('下載完成!')

最終效果:
python 爬取 mc 皮膚
皮膚爬取的原理是透過json格式來檢視網站的每一張圖片的id號,再用拼接的方式組成一個圖片地址,最後再用二進位制的方式把圖片存放在我們的資料夾裡。希望各位能透過這篇文章學到東西。

本作品採用《CC 協議》,轉載必須註明作者和本文連結
coder Derek

相關文章