Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

松鼠愛吃餅乾發表於2020-10-09

Python爬蟲

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

原畫爬取

先看一下爐石傳說的原畫：
爐石傳說原畫連結:
http://news.4399.com/gonglue/lscs/kptj/

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

該網站通過點選檢視更多載入新的內容，本打算使用Selenium模擬點選獲取圖片資訊，嘗試發現原始碼中該按鈕並無相應的跳轉連結

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

這不應該啊沒有相應的跳轉連結點選後是如何載入新的圖片？

後來瀏覽整體網站原始碼後發現把問題想複雜根本不需要模擬點選檢視更多

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

網站其實已經載入了所有的卡牌原畫只是之後的原畫做了隱藏處理預設不展示 style=display

點選檢視更多後顯示原畫

那麼只需使用requests獲取網頁原始碼

用BeautiSoup/正規表示式/pyQuery解析元素遍歷相應img的url 即可下載

教訓：爬蟲前不要根據網頁所對的操作實施相應的程式碼爬取不要有這樣的思維定式首先要做的是先大體瀏覽分析整個網頁的原始碼有的可能直接寫在原始碼或json或js中無需再加工

卡牌爬取

爐石傳說卡牌連結:
http://cha.17173.com/hs/

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

該網站通過下拉右邊的滾動條不斷載入新的卡牌

與上一個網站不同上一個網站一次性寫入了所有卡牌只不過做了隱藏處理

該網站是通過js動態載入渲染出的卡牌直接獲取原始碼無法得到所有卡牌資訊

那麼就用selenium模擬下拉滾動條（selenium簡直居家必備之神器）

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

使用selenium執行js指令碼每次執行下拉1000個單位滾動條執行90次

為什麼是90次測試出來的大概90次拉到底

注意：這裡要增加1~3秒的暫停時間用於網頁渲染

第一次沒有設定停留時間無法獲取新的資料懷疑自己懷疑人生

經前端/後端好友L君的提示需增加暫停時間這樣才能獲得載入渲染後的資料

browser.page_source便可獲得動態載入的所有資料

有了資料之後就很簡單正則匹配獲取相應url下載即可

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

既然獲得了這麼多卡牌和原畫不能浪費利用起來拼圖！

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

以上文章來源於碼農小黑屋，作者丨像我這樣的人丨

python爬蟲-requests與bs4獲得所有爐石傳說卡背
2019-02-16
Python爬蟲
Python爬蟲入門實戰之貓眼電影資料抓取（實戰篇）
2019-04-07
Python爬蟲
Python【爬蟲實戰】提取資料
2020-11-17
Python爬蟲
爐石完美卡牌的誕生
2019-08-09
《爐石傳說》新模式「傭兵戰紀」：設計巧妙的卡牌 RPG 玩法
2021-10-21
模式
以《爐石傳說》為例，從玩家決策視角聊聊卡牌遊戲的卡牌設計
2020-08-10
遊戲
Python爬蟲抓取股票資訊
2021-01-03
Python爬蟲
python爬蟲之抓取小說(逆天邪神)
2022-03-10
Python爬蟲
Python爬蟲入門實戰之貓眼電影資料抓取(理論篇)
2019-04-06
Python爬蟲
爐石傳說酒館戰棋姐夫好用嗎？爐石傳說的傑弗里斯英雄打法介紹
2020-10-24
爬蟲原理與資料抓取
2020-12-17
爬蟲
Python 爬蟲實戰
2023-10-16
Python爬蟲
《爐石傳說：傭兵戰紀》全球首曝，“爬塔”爐石大事件盡在TapTap遊戲釋出會
2021-07-14
事件APT遊戲
Python爬蟲新手教程：手機APP資料抓取 pyspider
2019-07-20
Python爬蟲APPIDE
爬蟲抓取網頁資料原理
2021-12-06
爬蟲網頁
爐石傳說對決模式怎麼玩？爐石傳說對決模式玩法介紹
2020-10-24
模式
Python爬蟲抓取資料，為什麼要使用代理IP？
2022-12-27
Python爬蟲
Python爬蟲如何去抓取qq音樂的歌手資料？
2021-03-19
Python爬蟲
python爬蟲抓取哈爾濱天氣資訊（靜態爬蟲）
2020-04-05
Python爬蟲
python爬蟲實戰教程-Python爬蟲開發實戰教程（微課版）
2020-11-11
Python爬蟲
Python 爬蟲實戰之爬拼多多商品並做資料分析
2023-10-17
Python爬蟲
python爬蟲實戰，爬蟲之路，永無止境
2022-01-27
Python爬蟲
python3網路爬蟲開發實戰_Python3 爬蟲實戰
2022-01-24
Python爬蟲
爬蟲實戰——58同城租房資料爬取
2019-12-04
爬蟲
win10玩爐石傳說藍色畫面怎麼辦_win10系統爐石傳說玩一會就藍色畫面如何解決
2020-02-09
Win10
Python網路爬蟲實戰
2022-03-18
Python爬蟲
python 爬蟲實戰的原理
2021-10-29
Python爬蟲
Python爬蟲實戰之bilibili
2021-04-04
Python爬蟲
python爬蟲-33個Python爬蟲專案實戰(推薦)
2020-10-28
Python爬蟲
用Python爬蟲抓取代理IP
2019-04-17
Python爬蟲
爬蟲技術抓取網站資料方法
2021-09-11
爬蟲網站
Python爬蟲實戰：爬取淘寶的商品資訊
2021-09-11
Python爬蟲
Python爬蟲新手教程：微醫掛號網醫生資料抓取
2019-07-20
Python爬蟲
除了模仿爐石，2020年卡牌對戰類遊戲還有哪些發展可能
2020-04-07
遊戲
大資料爬蟲專案實戰教程
2018-11-14
大資料爬蟲
API商品資料介面呼叫爬蟲實戰
2023-10-27
API爬蟲
實時獲取股票資料，免費！——Python爬蟲Sina Stock實戰
2021-10-13
Python爬蟲
python爬蟲練習--爬取虎牙主播原畫視訊
2020-11-28
Python爬蟲

Python爬蟲實戰：爐石傳說卡牌、原畫資料抓取

原畫爬取

卡牌爬取

相關文章