Python爬蟲進階之JS逆向土地市場網!
最近有朋友推薦了一個很簡單的需要 js 逆向的網站中國土地市場網
主要是需要獲取下面的資訊
分析
首先當然是抓包分析返回的資料 或者直接將連結放到程式碼裡面,將響應內容列印出來。 如果一樣的話說明直接就能獲取到,否則的話可能就是對網頁進行了處理等
上面是用程式碼請求返回的響應 html 中嵌入了 JS,而且很可能做了跳轉,因為有個 location 的變數
破解
下面是通過 Chrome 瀏覽器抓包的過程 經過了兩次跳轉
其中重定向的連結是在第一次請求返回的響應裡面,用 JS 生成的
so, 我們將返回的 JS 扣出來,在本地除錯下
其中有些用不到的引數,直接註釋掉 比如引數 curlocation 是當前頁面的 href,沒有用到,反而會給我們除錯增加阻礙 因為我們沒有 window 這個物件
執行這段 JS,直接生成我們所需的引數
驗證
從抓包中我們可以得知總共有三次清求 其中第一次和第二次都會生成驗證的 cookie
所以我們也用程式碼模擬三次請求 程式碼如下:
def spider(): response = session.get(url) text = response.text # f_js = re.findall("javascript\">(.*?)</script>", text)[0] ctx = execjs.compile(js) location = ctx.call("YunSuoAutoJump") second_url = "http://www.landchina.com" + location _ = session.get(second_url) res = session.get(url) selector = Selector(text=res) result = selector.css("#TAB_contentTable tr")[1:] td_list = result.css("td")
如果你依然在程式設計的世界裡迷茫,可以加入我們的Python學習扣qun:784758214,看看前輩們是如何學習的!交流經驗!自己是一名高階python開發工程師,從基礎的python指令碼到web開發、爬蟲、django、資料探勘等,零基礎到專案實戰的資料都有整理。送給每一位python的小夥伴!分享一些學習的方法和需要注意的小細節,點選加入我們的python學習者聚集地
最後我們看下能否提取出資料 結果一目瞭然!
相關文章
- Python爬蟲進階之JS逆向入門Python爬蟲JS
- Python爬蟲進階之APP逆向(三)Python爬蟲APP
- python爬蟲之JS逆向Python爬蟲JS
- python爬蟲之js逆向(三)Python爬蟲JS
- python爬蟲之js逆向(二)Python爬蟲JS
- Python爬蟲之JS逆向分析技巧Python爬蟲JS
- python爬蟲js逆向Python爬蟲JS
- python爬蟲之JS逆向某易雲音樂Python爬蟲JS
- python爬蟲js逆向學習(二)Python爬蟲JS
- python爬蟲進階必備之代理Python爬蟲
- Python爬蟲進階之會話和CookiesPython爬蟲會話Cookie
- python爬蟲簡單實現逆向JS解密Python爬蟲JS解密
- Python爬蟲,JS逆向之 webpack 打包站點原理與實戰Python爬蟲JSWeb
- Python爬蟲進階之urllib庫使用方法Python爬蟲
- 網路爬蟲之記一次js逆向解密經歷爬蟲JS解密
- python入門與進階篇(七)之原生爬蟲Python爬蟲
- Python爬蟲進階之代理的基本原理Python爬蟲
- python爬蟲之快速對js內容進行破解Python爬蟲JS
- 爬蟲進階:反反爬蟲技巧爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- Python 爬蟲從入門到進階之路(十)Python爬蟲
- Python 爬蟲從入門到進階之路(十五)Python爬蟲
- Python 爬蟲從入門到進階之路(九)Python爬蟲
- Python 爬蟲從入門到進階之路(十二)Python爬蟲
- Python 爬蟲從入門到進階之路(十七)Python爬蟲
- Python 爬蟲從入門到進階之路(二)Python爬蟲
- Python 爬蟲從入門到進階之路(十一)Python爬蟲
- Python 爬蟲從入門到進階之路(六)Python爬蟲
- Python 爬蟲從入門到進階之路(八)Python爬蟲
- Python 爬蟲從入門到進階之路(七)Python爬蟲
- Python 爬蟲從入門到進階之路(十八)Python爬蟲
- Python 爬蟲從入門到進階之路(十六)Python爬蟲
- Python 爬蟲從入門到進階之路(三)Python爬蟲
- Python爬蟲:逆向分析網易雲音樂加密引數Python爬蟲加密
- Python爬蟲js處理Python爬蟲JS
- Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示Python爬蟲網頁
- Python爬蟲實戰之叩富網Python爬蟲
- [Python] 網路爬蟲與資訊提取(1) 網路爬蟲之規則Python爬蟲