20行Python程式碼爬取王者榮耀全英雄皮膚

~wangweijun發表於2020-01-11

原文網址 : https://blog.csdn.net/qq_42453117/article/details/103190981

引言

王者榮耀大家都玩過吧，沒玩過的也應該聽說過，作為時下最火的手機MOBA遊戲，咳咳，好像跑題了。我們今天的重點是爬取王者榮耀所有英雄的所有皮膚，而且僅僅使用20行Python程式碼即可完成。

準備工作

爬取皮膚本身並不難，難點在於分析，我們首先得得到皮膚圖片的url地址，話不多說，我們馬上來到王者榮耀的官網：
在這裡插入圖片描述
我們點選英雄資料，然後隨意地選擇一位英雄，接著F12開啟除錯臺，找到英雄原皮膚的圖片地址：

接著，我們切換一下英雄的皮膚，會發現圖片地址沒有明顯的變化，只是最後的數字序號改變了，我們將兩個皮膚圖片的地址放在一起比較一下：

http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/523/523-bigskin-1.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/523/523-bigskin-2.jpg

我們可以猜測，對於同一個英雄的皮膚圖片地址，僅僅是最後的數字序號不同，為了證實我們的猜想，我們可以繼續找出一個英雄的全皮膚圖片，找一個皮膚多一點的，例如我這裡找的是孫尚香，將它的所有皮膚圖片地址放在一起比較：

http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-1.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-2.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-3.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-4.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-5.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-6.jpg
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/111/111-bigskin-7.jpg

由此我們得出結論，同一個英雄的皮膚圖片路徑從1開始依次遞增，我們再來看看不同英雄之間是如何區分的。會發現，不管皮膚圖片如何改變，瀏覽器上方的地址始終是不變的，所以我們將兩個不同英雄的url地址放到一起比較一下：

https://pvp.qq.com/web201605/herodetail/523.shtml
https://pvp.qq.com/web201605/herodetail/111.shtml

乍一看，似乎沒有什麼規律，但我們要從這裡發現一點，就是最後的數字其實控制的是哪個英雄，我們暫且認為它是英雄的編號，可不幸的是，英雄編號之間好像沒有什麼規律，不用著急，我們再到官網上找找線索。

在英雄資料介面，我們開啟F12除錯臺，通過抓取網路請求，我發現了幾個檔案：
在這裡插入圖片描述
點選網路，然後點選XHR，就可以看到這幾個檔案，看到檔案的名字大家應該就清楚了，這些檔案儲存的就是英雄列表資訊，我們點選檢視一下：

沒錯，這裡儲存的就是英雄資訊，包括英雄的名字，英雄編號等等其它資訊，我們可以試試這些資訊的準確性，例如小喬的ename，也就是英雄編號為106，所以按照之前的想法，英雄小喬的詳情地址應為：https://pvp.qq.com/web201605/herodetail/106.shtml
經過嘗試後發現確實如此。

到這裡，準備工作就完成了，其實進行到這裡，整個工程就完成了一半了，接下來就是程式碼的實現了。

程式碼實現

首先我們建立一個Python檔案，然後匯入os和requests模組。
按照前面的步驟，我們首先需要獲取到英雄列表資訊，也就是herolist.json檔案，檔案地址為：https://pvp.qq.com/web201605/js/herolist.json，這在除錯臺中可以找到。
那麼我們首先就要通過這個地址獲取到英雄列表資訊的json資料，然後解析json資料，將有用的資訊提取出來：

url = 'https://pvp.qq.com/web201605/js/herolist.json'
herolist = requests.get(url)  # 獲取英雄列表json檔案

herolist_json = herolist.json()  # 轉化為json格式
hero_name = list(map(lambda x: x['cname'], herolist.json()))  # 提取英雄的名字
hero_number = list(map(lambda x: x['ename'], herolist.json()))  # 提取英雄的編號

這樣我們就獲取到了英雄名字和編號，可以輸出測試一下：
拿到了英雄編號之後，事情就變得很簡單了，只需拼接一下url地址即可：
http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + hero_number + '/' + hero_number + '-bigskin-1.jpg，這樣可以獲取到所有英雄的皮膚圖片了，但是這裡會有一個問題，英雄的皮膚是有多有少的，有的英雄只有兩個皮膚，有的卻有六七個，所以圖片編號的最大值我們並不清楚，這裡我採用了一個比較笨的辦法，就是讓一個變數從1到10依次遞增去拼接圖片地址，如果遇到沒有的圖片我們就不處理，因為沒有一個英雄的皮膚超過了10個，所以我們就能獲取到所有的圖片了。下面看程式碼實現：

# 下載圖片
def downloadPic():
    i = 0
    for j in hero_number:
        # 建立資料夾
        os.mkdir("C:\\Users\\Administrator\\Desktop\\wzry\\" + hero_name[i])
        # 進入建立好的資料夾
        os.chdir("C:\\Users\\Administrator\\Desktop\\wzry\\" + hero_name[i])
        i += 1
        for k in range(10):
            # 拼接url
            onehero_link = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + str(j) + '/' + str(
                j) + '-bigskin-' + str(k) + '.jpg'
            im = requests.get(onehero_link)  # 請求url
            if im.status_code == 200:
                open(str(k) + '.jpg', 'wb').write(im.content)  # 寫入檔案

實現非常地簡單，程式碼註釋也已經寫得很清楚了，有了這個函式之後，我們只需呼叫一下，就可以下載圖片了，整個程式的完整程式碼如下：

import os
import requests

url = 'https://pvp.qq.com/web201605/js/herolist.json'
herolist = requests.get(url)  # 獲取英雄列表json檔案

herolist_json = herolist.json()  # 轉化為json格式
hero_name = list(map(lambda x: x['cname'], herolist.json()))  # 提取英雄的名字
hero_number = list(map(lambda x: x['ename'], herolist.json()))  # 提取英雄的編號


# 下載圖片
def downloadPic():
    i = 0
    for j in hero_number:
        # 建立資料夾
        os.mkdir("C:\\Users\\Administrator\\Desktop\\wzry\\" + hero_name[i])
        # 進入建立好的資料夾
        os.chdir("C:\\Users\\Administrator\\Desktop\\wzry\\" + hero_name[i])
        i += 1
        for k in range(10):
            # 拼接url
            onehero_link = 'http://game.gtimg.cn/images/yxzj/img201606/skin/hero-info/' + str(j) + '/' + str(
                j) + '-bigskin-' + str(k) + '.jpg'
            im = requests.get(onehero_link)  # 請求url
            if im.status_code == 200:
                open(str(k) + '.jpg', 'wb').write(im.content)  # 寫入檔案


downloadPic()

除去註釋，接近20行的程式碼我們就完成了王者榮耀全英雄皮膚的爬取，是不是非常簡單呢？我們可以測試一下這個程式，首先要在桌面上建立一個資料夾，名為wzry，因為這裡的程式碼我已經寫死了，如果要修改的話大家也可以進行修改，資料夾建立完成後點選執行即可，等待片刻，圖片就全部下載完成了。
在這裡插入圖片描述

對於程式中json字串的解析，我們還可以使用jsonpath模組來進行，使用該模組能夠更加快捷地獲取到我們想要的資訊，解析方式如下：

hero_name = jsonpath.jsonpath(html_json, "$..cname")
hero_number = jsonpath.jsonpath(html_json, "$..ename")

該方法接收一個json字串和解析規則，$…cname則表示從根目錄下找尋任意位置的以cname為鍵的值，並放入字典中。

結尾

爬蟲是非常有趣的，因為它非常直觀，視覺衝擊感強，寫出來也很有成就感，爬蟲雖然強大，但千萬不能隨意爬取隱私資訊。

最後，如果對文中程式有更好的建議，歡迎評論區留言。

Python爬取王者榮耀英雄皮膚高清圖片
2018-11-07
Python
python爬取王者榮耀皮膚
2020-10-06
Python
爬蟲小程式 - 爬取王者榮耀全皮膚
2020-01-31
爬蟲
用Python爬取"王者農藥"英雄皮膚
2019-03-23
Python
用Python爬取《王者榮耀》英雄皮膚資料並視覺化分析，用圖說話
2021-08-17
Python視覺化
Python教你一鍵獲得【王者榮耀全皮膚】~~~
2020-12-03
Python
王者榮耀英雄以及英雄皮膚品質升級：新增英雄區域背景!
2018-12-29
Python 爬取 "王者榮耀.英雄桌布" 過程中的矛和盾
2022-03-05
Python
Python3爬取英雄聯盟英雄皮膚大圖
2018-11-14
Python
用Python爬取英雄聯盟（lol）全部皮膚
2020-11-30
Python
python 爬取 mc 皮膚
2019-08-02
Python
王者榮耀什麼英雄剋制嫦娥？王者榮耀這幾個英雄可以剋制嫦娥
2019-01-22
王者榮耀新英雄盾山怎麼玩攻略王者榮耀新英雄盾山技能是什麼?
2018-09-18
論王者榮耀爭議頻出的皮膚錨點設計
2020-05-14
王者榮耀剋制米萊狄的英雄有哪些？王者榮耀剋制米萊狄的英雄介紹
2019-02-06
王者榮耀為什麼會保留銘文系統和皮膚屬性加成？
2020-01-03
天美分享《王者榮耀》五週年李小龍限定皮膚創作歷程
2020-11-05
王者榮耀豬八戒剋星是誰？王者榮耀剋制豬八戒的英雄介紹
2020-07-01
python 爬蟲 mc 皮膚站 little skin 的簡單爬取
2019-08-02
Python爬蟲
《王者榮耀》新英雄“元歌”曝光：4個技能傀儡師
2018-05-22
《王者榮耀》上線反派新英雄：諸葛亮宿敵
2018-07-24
《王者榮耀》新英雄狂鐵曝光：麒麟臂耍電錘
2018-03-21
王者榮耀「冰山下」
2020-07-28
王者榮耀故事站小程式（nuxt + 小程式）
2019-02-16
UX
無人能擋！王者榮耀的四技能英雄都是神一般的英雄
2018-10-25
王者榮耀S14狂鐵的剋星英雄、最佳搭檔英雄詳解
2019-03-04
王者榮耀官方釋出聖誕活動預告，蔡文姬新皮膚12月22日上架
2018-12-17
專訪《王者榮耀》美術總監：做了五年皮膚，我們還是怕只做到表面
2020-11-10
王者榮耀四大神獸主題皮膚曝光：玄策是白虎，花木蘭或是朱雀！
2019-01-05
王者榮耀進階戰令怎麼獲取？榮耀戰令進階版的獲取方法
2019-11-04
Python獲取英雄聯盟皮膚原畫：新手玩家們都懵了！
2020-10-10
Python
王者榮耀墨子技能解析與使用技巧,王者榮耀墨子大招使用技巧
2019-01-16
python對英雄皮膚進行圖片採集~
2022-08-03
Python
王者榮耀小喬怎麼玩？王者榮耀小喬技能介紹和玩法攻略
2019-01-08
王者榮耀李白該怎麼出裝？王者榮耀李白出裝及順序解析
2019-01-17
王者榮耀“吃雞模式”玩法介紹王者榮耀邊境突圍怎麼玩
2018-07-10
模式
2018王者榮耀KPL秋季賽賽程表 2018王者榮耀KPL秋季賽賽制
2018-09-03
《王者榮耀》新模式“契約之戰”來了：一人操作倆英雄
2018-03-21
模式

20行Python程式碼爬取王者榮耀全英雄皮膚

引言

準備工作

程式碼實現

結尾

相關文章