猿人學web端爬蟲攻防大賽賽題第17題——天殺的http2.0

死不悔改奇男子發表於2024-10-30

原文網址 : https://www.cnblogs.com/sbhglqy/p/18516477

題目網址： https://match.yuanrenxue.cn/match/17

解題步驟：

老方法，看觸發的資料包。
只有一個資料包，再看cookie中有沒有特殊的欄位。
沒有遇到第13題的特殊欄位，直接訪問。

import requests

url = "https://match.yuanrenxue.cn/api/match/17?page=1"
headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 "
                  "Safari/537.36",
    "cookie": "sessionid=1zl8qqmuijewpn1pxji9epmjvoaz5ipi; Hm_lvt_9bcbda9cbf86757998a2339a0437208e=1729915594,1729937930,1729945496,1730034166; Hm_lpvt_9bcbda9cbf86757998a2339a0437208e=1730284775"}
resp = requests.get(url, headers=headers)
print(resp.text)

執行卻得不到頁面上的數字。

4. 到底哪裡出了問題呢，再結合題目http2.0，難道要用http2.0協議，先檢視當前流量包的協議。這裡以chrome瀏覽器為例，右擊流量包，選擇Header Options然後選擇Protocol，就會顯示協議號。

5. 確定是http2.0協議了。根據官方說明，requests只支援http1.1協議，所以這裡就不能能用requests庫了。

6. 經過網上搜尋，Hyper和Httpx兩個庫支援http2.0。
hyper的話，不是很適用，因為很多功能跟requests庫沒法類比，所以這裡選用httpx。
httpx的安裝：pip install httpx[http2] # 這樣寫才能裝上支援http2的httpx，不寫的話預設是不支援http2的
7. 用httpx庫嘗試去訪問一下，用法與requests庫差不多。

import httpx
import re

client = httpx.Client(http2=True)
sum_num = 0
for i in range(1, 6):
    url = "https://match.yuanrenxue.cn/api/match/17?page={}".format(i)
    # print(url)
    headers = {
        "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/130.0.0.0 "
                      "Safari/537.36",
        "cookie": "sessionid=1zl8qqmuijewpn1pxji9epmjvoaz5ipi; Hm_lvt_9bcbda9cbf86757998a2339a0437208e=1729915594,1729937930,1729945496,1730034166; Hm_lpvt_9bcbda9cbf86757998a2339a0437208e=1730284775"}
    resp = client.get(url, headers=headers)
    pattern = r'{"value": (?P<num>.*?)}'
    findall = re.findall(pattern, resp.text)
    for item in findall:
        # print(item)
        sum_num += int(item)
print(sum_num)

執行結果如下。

8. 提交結果，成功通關。

猿人學web端爬蟲攻防大賽賽題第6題——js 混淆 - 回溯
2024-11-16
Web爬蟲JS
猿人學web端爬蟲攻防大賽賽題第20題——2022新春快樂
2024-11-17
Web爬蟲
猿人學web端爬蟲攻防大賽賽題第16題——js逆向 - window蜜罐
2024-11-02
Web爬蟲JS
猿人學web端爬蟲攻防大賽賽題第1題——js 混淆 - 原始碼亂碼
2024-10-31
Web爬蟲JS原始碼
猿人學web端爬蟲攻防大賽賽題第19題——烏拉烏拉烏拉
2024-11-02
Web爬蟲
猿人學web端爬蟲攻防大賽賽題第15題——備周則意怠-常見則不疑
2024-11-01
Web爬蟲
猿人學爬蟲攻防賽總結
2018-10-26
爬蟲
獎金三萬，猿人學爬蟲對抗大賽來啦
2018-10-13
爬蟲
Js逆向之猿人學比賽第一題
2020-12-03
JS
XCTF攻防世界--（新手賽區）第3題快來圍觀學習！
2022-05-26
XCTF攻防世界--（新手賽區）第4題快來圍觀學習！
2022-05-26
XCTF攻防世界--（新手賽區）第2題快來圍觀學習！
2022-05-20
2024廣東大學生攻防大賽WP
2024-05-13
2022廣東大學生攻防大賽WP
2024-05-13
CSDN周賽第35期：贏《阿里雲天池大賽賽題解析―深度學習篇》和定製周邊
2023-03-07
阿里深度學習
2024哈佛-麻省數學競賽（HMMT）2月錦標賽團體賽第9題
2024-03-08
HMM
[補題] 第 45 屆國際大學生程式設計競賽（ICPC）亞洲區域賽（上海）
2020-12-19
程式設計
第15屆浙江省大學生程式設計競賽D題
2020-10-01
程式設計
[leetcode 第 400 場周賽]題解
2024-06-02
LeetCode
猿人學內部練習平臺第54~60題
2024-06-07
把猿人學爬蟲課的著作權登記成功了
2020-07-08
爬蟲
【CSDN競賽第27期】贏圖書《阿里雲天池大賽賽題解析—機器學習篇》和定製周邊
2023-02-02
阿里機器學習
2020“數維杯”國際大學生數學建模競賽賽題分析
2020-12-01
2020中國電信“天翼杯”網路安全攻防大賽初賽順利舉辦
2020-08-04
湖南大學2020屆ACM新生賽部分題解
2021-01-03
ACM
猿人學內部第三題
2024-06-27
第 178 場力扣周賽第二題
2020-03-01
力扣
Leetcode 第136場周賽解題報告
2019-05-14
LeetCode
素養賽Python複賽題——錯排問題
2024-06-16
Python
無錫學院2024年ACM大學生程式設計競賽校選賽題解
2024-04-11
ACM程式設計
東北林業大學第15屆校賽（大一組）+雜題+訓練一
2020-12-22
記一道國際賽CTF web題
2023-05-04
Web
撩課-Java每天5道面試題第17天
2018-12-07
Java面試題
Web 端反爬蟲技術方案
2019-03-04
Web爬蟲
2021騰訊PC客戶端初賽題解(對大佬解題手法的學習)
2021-04-22
客戶端
猿人學內部練習平臺第21、22、24、29、34題
2024-06-01
2022 DSCTF首屆數字空間安全攻防大賽初賽戰果出爐，15支尖兵殺出重圍
2022-07-19
2020年lfyz演算法設計大賽賽後題解
2020-12-02
演算法

猿人學web端爬蟲攻防大賽賽題第17題——天殺的http2.0

相關文章