Python教程:如何免驗證跳轉到內容頁?

markriver發表於2021-09-11

相信很多人在瀏覽網頁時,經常會碰到需要輸入驗證碼才可以繼續瀏覽的情況吧,遇到這種問題,大多數人只能進行繁瑣的註冊驗證,今天小編教大家只要使用python就可以免驗證方法。

以經常用到的解答網站——上學吧為例,在網站裡點選答案頁面,會顯示驗證後才可以檢視提示,下面就使用python實現跳過驗證碼。

Python教程:如何免驗證跳轉到內容頁?

我們需要透過python構造隨機的 X-Forwarded-For 資訊來繞過 ASP 網站的 IP 檢測,可以實現對輸入的網址正確性進行檢查、對驗證碼核驗不透過時的處理等等。

python免驗證跳轉頁面程式碼如下:

# 繞過驗證碼無限次獲取上學吧題目答案
# 上學吧網址:
import os
import random
import requests
import urllib3
urllib3.disable_warnings() # 這句和上面一句是為了忽略 https 安全驗證警告,參考:https://www.cnblogs.com/ljfight/p/9577783.html
from bs4 import BeautifulSoup
from PIL import Image
def get_verifynum(session): # 網址的驗證碼邏輯是先去這個網址獲取驗證碼圖片,提交計算結果到另外一個網址進行驗證。
r = session.get("/VerifyCode2.aspx", verify=False) # HTTPS 請求進行 SSL 驗證或忽略 SSL 驗證才能請求成功,忽略方式為 verify=False。參考:https://www.cnblogs.com/ljfight/p/9577783.html
with open('temp.png','wb+') as f:
f.write(r.content)
image = Image.open('temp.png')
image.show() # 呼叫系統的圖片檢視軟體開啟驗證碼圖片,如果不能開啟,可以自己找到 temp.png 開啟。
verifynum = input("n請輸入驗證碼圖片中的計算結果:")
image.close()
os.remove("temp.png")
return verifynum
def get_question(session):
r = session.get(link)
soup = BeautifulSoup(r.content, "html.parser")
description = soup.find(attrs={"name":"description"})['content'] # 抓取題幹內容
return description
def get_answer(session, verifynum, dataid):
data1 = {
"Verify": verifynum,
"action": "CheckVerify",
}
session.post("/ajax/GetZuiJia.aspx", data=data1) # 核查驗證碼正確性
data2 = {
"phone":"",
"dataid": dataid,
"action": "submitVerify",
"siteid": "1001",
"Verify": verifynum,
}
r = session.post("/ajax/GetZuiJia.aspx", data=data2)
soup = BeautifulSoup(r.content, "html.parser")
ans = soup.find('h6')
print("n" + '-'*45)
if(ans): # 只有驗證碼核查透過才會顯示答案
print("n題目:" + get_question(session))
print(ans.text)
else:
print('n沒有找到答案!請檢查驗證碼或網址是否輸入有誤!n')
print('-'*45)
if __name__ == '__main__':
s = requests.session()
while True:
s.headers.update({"X-Forwarded-For":"%d.%d.%d.%d"%(random.randint(120,125),random.randint(1,200),random.randint(1,200),random.randint(1,200))}) # 這一句是整個程式的關鍵,透過修改 X-Forwarded-For 資訊來欺騙 ASP 站點對於 IP 的驗證。
link = input("n請輸入上學吧網站上某道題目的網址,例如:/8952241.htmlnn請輸入:").strip() # 過濾首尾的空格
if(link[0:31] != "/" or link[-4:] != "html"):
print("n網址輸入有誤!請重新輸入!n")
continue
dataid = link.split("/")[-1].replace(r".html","") # 提取網址最後的數字部分
if(dataid.isdigit()): # 根據格式,dataid 應該全部為數字,判斷字串是否全部為數字,返回 True 或者 False
verifynum = get_verifynum(s)
get_answer(s, verifynum, dataid)
else:
print("n網址輸入有誤!請重新輸入!n")
continue

注意:其中 requests 和 beautifulsoup 兩個庫需要另外安裝,建議使用 pip 方式安裝:

pip install requests
pip install beautifulsoup4

Python 指令碼執行流程:

首先複製上學吧某道題目的網址,類似以下格式:

Python教程:如何免驗證跳轉到內容頁?

然後執行python指令碼,複製貼上網址。

Python教程:如何免驗證跳轉到內容頁?

按Enter鍵,自動下載驗證碼圖片存為 temp.png,然後自動讀取圖片並展示,也可以手動開啟同目錄下的 temp.png 圖片。

Python教程:如何免驗證跳轉到內容頁?

最後在命令列視窗輸入驗證碼圖片中的計算結果即可獲取題目詳情以及正確答案。

Python教程:如何免驗證跳轉到內容頁?

以上就是PyThon免驗證跳轉內容頁的全部內容了,感興趣的小夥伴可以跟著教程實際操作~如需瞭解更多python實用知識,點選進入。

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/818/viewspace-2832540/,如需轉載,請註明出處,否則將追究法律責任。

相關文章