爬蟲如何利用session方法保持登陸狀態(selenium)
爬取網站頁面時需要登入後才能訪問,否則獲取不到頁面的實際響應資料
有些網站需要我們登陸才能獲取訪問資料,然而往往登陸頁和所要爬取的資料不在同一頁面,這裡一般都會想到對cookies進行處理的方法,如下所示:
1、先成功登入1次,獲取到cookies,處理為字典
2、再改送請求,requests.get(xxx, cookies=cookies)
然而requests模組為我們提供一個更加方便的方法,名為session,可以幫助我們維持客戶端和服務端的會話狀態而不斷開:
# 1、例項化session物件
session = requests.session()
# 2、讓session物件傳送get或者post請求
post_data = {'email':'','password':''}
res = session.post(url=url, data=post_data, headers=headers) # 登陸
res = session.get(url=url, headers=headers)
原理
瀏覽器原理: 訪問需要登入的頁面會帶著之前登入過的cookie
程式原理: 同樣帶著之前登入的cookie去訪問 - 由session物件完成
1、例項化session物件
2、登入網站: session物件傳送請求,登入對應網站,把cookie儲存在session物件中
3、訪問頁面: session物件請求需要登入才能訪問的頁面,session能夠自動攜帶之前的這個cookie,進行請求
selenium實現
模擬點選,再用switch_to切換網頁
相關文章
- python爬蟲如何用session保持登入?Python爬蟲Session
- Python爬蟲學習(8):浙大軟院網路登陸保持Python爬蟲
- 那些年,我爬過的北科(二)——爬蟲基礎之session登陸爬蟲Session
- python 爬蟲網頁登陸Python爬蟲網頁
- 爬蟲之普通的模擬登陸爬蟲
- 利用CSP探測網站登陸狀態(alipay/baidu為例)網站AI
- HtmlUnit 爬蟲簡單案例——模擬登陸CSDNHTML爬蟲
- 爬蟲實戰(二):Selenium 模擬登入並爬取資訊爬蟲
- requests請求狀態保持-登入github為例Github
- Vue外賣十一:登入成功資訊顯示、瀏覽器cookie+後端session登入狀態保持Vue瀏覽器Cookie後端Session
- 第九章 表單和登陸爬蟲爬蟲
- 爬蟲-selenium的使用爬蟲
- httpWebRequest保持session的方法HTTPWebSession
- 如何利用 Selenium 爬取評論資料?
- Python爬蟲之路-selenium在爬蟲中的使用Python爬蟲
- Linux使用者密碼後不能登陸(回到原登陸狀態)問題Linux密碼
- Flutter 中如何保持Tabbar和TabbarView的狀態?FluttertabBarView
- 通過session模擬登陸Session
- HTTP狀態保持的原理HTTP
- selenium+python設定爬蟲代理IP的方法Python爬蟲
- Python 爬蟲模擬登入方法彙總Python爬蟲
- 如何利用Python網路爬蟲抓取微信朋友圈的動態(上)Python爬蟲
- 爬蟲Selenium+PhantomJS爬取動態網站圖片資訊(Python)爬蟲JS網站Python
- PHP 會話(Session)如何實現使用者登陸功能PHP會話Session
- 呼叫瀏覽器的爬蟲——selenium瀏覽器爬蟲
- Python爬蟲基礎之seleniumPython爬蟲
- 【開發必備】單點登入,清除了cookie,頁面還保持登入狀態?Cookie
- 為爬蟲獲取登入cookies:使用萬能鑰匙 Selenium 搞定一切登入爬蟲Cookie
- 如何利用代理ip提高爬蟲的工作效率爬蟲
- Selenium爬蟲遇到超時TimeOut問題的解決方法爬蟲
- postgresql如何登陸SQL
- 彈射回合登場!《蟲蟲物語》今日正式登陸iOS端iOS
- python+pytest介面自動化(9)-cookie繞過登入(保持登入狀態)PythonCookie
- 獲取爬蟲動態IP的三種方法爬蟲
- 【Oracle】-【v$session】v$session的SNIPED狀態OracleSession
- HttpWebRequest 保持sessionHTTPWebSession
- python實現selenium網路爬蟲Python爬蟲
- python 爬蟲——登入知乎Python爬蟲