用Python爬取英雄聯盟(lol)全部皮膚

Python小二發表於2020-11-30

小三:“怎麼了小二?一副無精打采的樣子!”

小二:“唉!別提了,還不是最近又接觸了一個叫英雄聯盟的遊戲,遊戲中很多皮膚都需要花錢買,但是我錢不夠呀...”

小三:“咋得,錢攢夠了你還要買呀?還吃不吃飯了?!要我說,你乾脆將英雄的炫彩皮膚都爬下來欣賞一下得了,飯錢還給你省下了。”

小二:“你說的也對,畢竟吃飯更重要,那我還是爬取皮膚欣賞一下算了。”

首先,我們開啟英雄聯盟官網主頁,網址為:https://lol.qq.com/main.shtml,然後向下拉,可以看到英雄列表,如圖所示:

接著隨意選一個英雄點選進入看一下,如圖所示:

再點選滑鼠右鍵,接著選擇檢查,看一下皮膚的 URL,如圖所示:

通過觀察,可以發現英雄皮膚 URL 組成方式為:https://game.gtimg.cn/images/lol/act/img/skin/big + 英雄id + 皮膚id.jpg

我們先看皮膚id,也就是看皮膚的個數,選擇開發者工具的Network項,之後重新整理一下頁面,可以發現有一個17.js的請求,17實際就是英雄id,如圖所示:

再選擇Response項看一下相應資料,如圖所示:

我們可以看到資料都顯示在了一行,看著不太方便,我們將其格式化看一下,如圖所示:

通過觀察,可以發現獲取指定英雄皮膚id的 URL 就是:https://game.gtimg.cn/images/lol/act/img/js/hero/ + 英雄id.js,獲取皮膚id及下載皮膚圖片的程式碼實現如下:

hero_skin_url = 'https://game.gtimg.cn/images/lol/act/img/js/hero/' + hero_id + '.js'
# 通過 url 獲取英雄的皮膚數量
skin_text = requests.get(hero_skin_url).text
skin_json = json.loads(skin_text)
skin_list = skin_json['skins']
# 獲取皮膚名
hero_skins.clear()
for skin in skin_list:
    hero_skins.append(skin['name'].replace('/', '').replace('\\', '').replace(' ', ''))
# 皮膚數量
skins_num = len(hero_skins)
s = ''
for i in tqdm(range(skins_num), desc='【' + hero_name + '】皮膚下載'):
    if len(str(i)) == 1:
        s = '00' + str(i)
    elif len(str(i)) == 2:
        s = '0' + str(i)
    elif len(str(i)) == 3:
        pass
    try:
        # 拼接指定皮膚的 url
        skin_url = 'https://game.gtimg.cn/images/lol/act/img/skin/big' + hero_id + '' + s + '.jpg'
        img = requests.get(skin_url)
    except:
        # 沒有炫彩皮膚 url 則跳過
        continue
    # 儲存皮膚圖片
    if img.status_code == 200:
        with open(hero_skins[i] + '.jpg', 'wb') as f:
            f.write(img.content)

現在就差英雄id引數的獲取了,我們接著看如何獲取全部的英雄id,返回到 https://lol.qq.com/main.shtml頁面,開啟開發者工具並選擇Network,然後重新整理頁面,我們可以觀察到有一個hero_list.js的請求,如圖所示:

皮膚id的獲取基本類似,通過這個請求就可以獲取到英雄的全部英雄id,程式碼實現如下:

url = 'https://game.gtimg.cn/images/lol/act/img/js/heroList/hero_list.js'
hero_text = requests.get(url).text
# 轉為 json 格式
hero_json = json.loads(hero_text)['hero']
path = os.getcwd()
# 獲取當前資料夾路徑
workspace = os.getcwd()
# 皮膚路徑
skin_path = "{}\\{}".format(workspace, 'skins')
# 遍歷列表
for hero in hero_json:
    # 將每一個英雄的 id、name 放入一個字典中
    hero_dict = {'id': hero['heroId'], 'name': hero['name']}
    # 放入列表
    heros.append(hero_dict)

我們可以看出:程式碼中除了英雄id,還獲取了英雄name,並將每一個英雄的idname放在了一個字典中,又將所有英雄對應的字典放在了列表中。

最後,我們看一下下載效果:

原始碼在公眾號 Python小二 後臺回覆 201130 獲取。

相關文章