Python爬蟲進階之JS逆向土地市場網！

Python資深程式設計師發表於2019-08-17

Python爬蟲JS

最近有朋友推薦了一個很簡單的需要 js 逆向的網站中國土地市場網

主要是需要獲取下面的資訊

分析

首先當然是抓包分析返回的資料或者直接將連結放到程式碼裡面，將響應內容列印出來。如果一樣的話說明直接就能獲取到，否則的話可能就是對網頁進行了處理等

上面是用程式碼請求返回的響應 html 中嵌入了 JS，而且很可能做了跳轉，因為有個 location 的變數

破解

下面是通過 Chrome 瀏覽器抓包的過程經過了兩次跳轉

其中重定向的連結是在第一次請求返回的響應裡面，用 JS 生成的

so, 我們將返回的 JS 扣出來，在本地除錯下

其中有些用不到的引數，直接註釋掉比如引數 curlocation 是當前頁面的 href，沒有用到，反而會給我們除錯增加阻礙因為我們沒有 window 這個物件

執行這段 JS，直接生成我們所需的引數

驗證

從抓包中我們可以得知總共有三次清求其中第一次和第二次都會生成驗證的 cookie

所以我們也用程式碼模擬三次請求程式碼如下：

def spider():
    response = session.get(url)

    text = response.text
    # f_js = re.findall("javascript\">(.*?)</script>", text)[0]

    ctx = execjs.compile(js)
    location = ctx.call("YunSuoAutoJump")
    second_url = "http://www.landchina.com" + location

    _ = session.get(second_url)

    res = session.get(url)

    selector = Selector(text=res)

    result = selector.css("#TAB_contentTable tr")[1:]
    td_list = result.css("td")

如果你依然在程式設計的世界裡迷茫，可以加入我們的Python學習扣qun：784758214，看看前輩們是如何學習的！交流經驗！自己是一名高階python開發工程師，從基礎的python指令碼到web開發、爬蟲、django、資料探勘等，零基礎到專案實戰的資料都有整理。送給每一位python的小夥伴！分享一些學習的方法和需要注意的小細節，點選加入我們的python學習者聚集地

最後我們看下能否提取出資料結果一目瞭然！

Python爬蟲進階之JS逆向入門
2019-05-29
Python爬蟲JS
Python爬蟲進階之APP逆向(三)
2019-06-01
Python爬蟲APP
python爬蟲之JS逆向
2022-06-11
Python爬蟲JS
python爬蟲之js逆向（三）
2020-01-06
Python爬蟲JS
python爬蟲之js逆向（二）
2019-11-05
Python爬蟲JS
Python爬蟲之JS逆向分析技巧
2020-04-17
Python爬蟲JS
python爬蟲js逆向
2019-09-22
Python爬蟲JS
python爬蟲之JS逆向某易雲音樂
2022-06-11
Python爬蟲JS
python爬蟲js逆向學習（二）
2020-07-03
Python爬蟲JS
python爬蟲進階必備之代理
2021-12-23
Python爬蟲
Python爬蟲進階之會話和Cookies
2021-09-11
Python爬蟲會話Cookie
python爬蟲簡單實現逆向JS解密
2019-08-29
Python爬蟲JS解密
Python爬蟲，JS逆向之 webpack 打包站點原理與實戰
2022-05-23
Python爬蟲JSWeb
Python爬蟲進階之urllib庫使用方法
2021-09-11
Python爬蟲
網路爬蟲之記一次js逆向解密經歷
2019-05-29
爬蟲JS解密
python入門與進階篇(七)之原生爬蟲
2018-10-07
Python爬蟲
Python爬蟲進階之代理的基本原理
2021-09-11
Python爬蟲
python爬蟲之快速對js內容進行破解
2019-07-08
Python爬蟲JS
爬蟲進階：反反爬蟲技巧
2018-06-28
爬蟲
python爬蟲---網頁爬蟲，圖片爬蟲，文章爬蟲，Python爬蟲爬取新聞網站新聞
2019-01-04
Python爬蟲網頁網站
Python 爬蟲從入門到進階之路（十）
2019-07-03
Python爬蟲
Python 爬蟲從入門到進階之路（十五）
2019-07-10
Python爬蟲
Python 爬蟲從入門到進階之路（九）
2019-07-02
Python爬蟲
Python 爬蟲從入門到進階之路（十二）
2019-07-05
Python爬蟲
Python 爬蟲從入門到進階之路（十七）
2019-07-12
Python爬蟲
Python 爬蟲從入門到進階之路（二）
2019-06-20
Python爬蟲
Python 爬蟲從入門到進階之路（十一）
2019-07-04
Python爬蟲
Python 爬蟲從入門到進階之路（六）
2019-06-27
Python爬蟲
Python 爬蟲從入門到進階之路（八）
2019-07-01
Python爬蟲
Python 爬蟲從入門到進階之路（七）
2019-06-28
Python爬蟲
Python 爬蟲從入門到進階之路（十八）
2019-07-15
Python爬蟲
Python 爬蟲從入門到進階之路（十六）
2019-07-11
Python爬蟲
Python 爬蟲從入門到進階之路（三）
2019-06-21
Python爬蟲
Python爬蟲：逆向分析網易雲音樂加密引數
2020-09-14
Python爬蟲加密
Python爬蟲js處理
2020-03-31
Python爬蟲JS
Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示
2020-09-14
Python爬蟲網頁
Python爬蟲實戰之叩富網
2021-04-04
Python爬蟲
[Python] 網路爬蟲與資訊提取（1）網路爬蟲之規則
2020-11-06
Python爬蟲

Python爬蟲進階之JS逆向土地市場網！

分析

破解

驗證

相關文章