Python爬蟲——實戰一:爬取京東產品價格(逆向工程方法)
在京東的單個產品頁面上,通過檢視原始碼檢查html,可以看到
<span class="p-price"><span>¥</span><span class="price J-p-1279836"></span></span>
這裡沒有直接給出價格。
這是因為價格資料是通過JS動態載入的,而HTML原始碼中並不包含動態載入的頁面內容。
獲取京東商品的價格
#-*- coding:utf-8 -*-
import urllib2
import json
def jd_price(url):
sku = url.split('/')[-1].strip(".html")
print sku
price_url = "https://p.3.cn/prices/mgets?skuIds=J_" + sku
response = urllib2.urlopen(price_url)
content = response.read()
result = json.loads(content)
print result
record = result[0]
#print "price:", record['p']
return record['p']
if __name__=="__main__":
jd_price("https://item.jd.com/12419422058.html")
上述程式碼的關鍵在於https://p.3.cn/prices/mgets?skuIds=J_12419422058” ,開啟這個連結,可以看到:
這個就是針對價格請求返回的響應頁面,其中”p”表示的就是商品的價格。
如何知道上面的URL中有價格資訊呢?
在火狐瀏覽器中安裝了Firebug。右鍵點選商品價格,選擇“使用Firebug檢視元素”,可以看到開啟的“HTML”中包含了價格資訊。這是因為Firebug的”HTML”顯示的是動態載入完所有資料後的原始碼。
現在選擇Firebug的“網路”,然後重新整理當前商品頁面。然後選擇“全部”,在“域”欄找到p.3.cn,該行對應的就是價格請求。
實際中遇到的問題
2017.8.22
在多次執行爬蟲之後,價格頁面返回的是
{"error":"pdos_captcha"}
採用渲染引擎方法。
相關文章
- Python爬蟲——實戰二:爬取天貓產品價格(逆向工程方法)Python爬蟲
- python 爬蟲實戰專案--爬取京東商品資訊(價格、優惠、排名、好評率等)Python爬蟲
- Python爬蟲實戰一:爬取csdn學院所有課程名、價格和課時Python爬蟲
- Python爬蟲爬取淘寶,京東商品資訊Python爬蟲
- 收藏的爬蟲逆向工程爬蟲
- Python爬蟲實戰:爬取淘寶的商品資訊Python爬蟲
- Python爬蟲實戰-使用Scrapy框架爬取土巴兔(一)Python爬蟲框架
- 網路爬蟲——爬蟲實戰(一)爬蟲
- Python爬蟲實戰詳解:爬取圖片之家Python爬蟲
- Python3.X 爬蟲實戰(併發爬取)Python爬蟲
- 爬蟲實戰(一):爬取微博使用者資訊爬蟲
- 用python編寫的抓京東商品價格的爬蟲Python爬蟲
- python爬蟲js逆向Python爬蟲JS
- Python 爬蟲實戰Python爬蟲
- [python爬蟲] BeautifulSoup爬取+CSV儲存貴州農產品資料Python爬蟲
- Python爬蟲實戰案例-爬取幣世界標紅快訊Python爬蟲
- python爬蟲實戰,爬蟲之路,永無止境Python爬蟲
- 圖靈樣書爬蟲 - Python 爬蟲實戰圖靈爬蟲Python
- [Python Scrapy爬蟲] 二.翻頁爬取農產品資訊並儲存本地Python爬蟲
- 爬蟲實戰——58同城租房資料爬取爬蟲
- python爬蟲實戰:爬取西刺代理的代理ip(二)Python爬蟲
- python爬蟲之JS逆向Python爬蟲JS
- Python 爬蟲實戰(2):股票資料定向爬蟲Python爬蟲
- 【Python爬蟲9】Python網路爬蟲例項實戰Python爬蟲
- python爬蟲實戰教程-Python爬蟲開發實戰教程(微課版)Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- Python實現微博爬蟲,爬取新浪微博Python爬蟲
- 爬蟲——爬取貴陽房價(Python實現)爬蟲Python
- 爬蟲實戰爬蟲
- [python 爬蟲]第一個Python爬蟲,爬取某個新浪部落格所有文章並儲存為doc文件Python爬蟲
- python3網路爬蟲開發實戰_Python3 爬蟲實戰Python爬蟲
- python爬蟲-33個Python爬蟲專案實戰(推薦)Python爬蟲
- python爬蟲之js逆向(三)Python爬蟲JS
- python爬蟲之js逆向(二)Python爬蟲JS
- Python爬蟲,JS逆向之 webpack 打包站點原理與實戰Python爬蟲JSWeb
- Python網路爬蟲實戰Python爬蟲
- python 爬蟲實戰的原理Python爬蟲
- Python爬蟲實踐--爬取網易雲音樂Python爬蟲