爬蟲如何利用session方法保持登陸狀態(selenium)
爬取網站頁面時需要登入後才能訪問,否則獲取不到頁面的實際響應資料
有些網站需要我們登陸才能獲取訪問資料,然而往往登陸頁和所要爬取的資料不在同一頁面,這裡一般都會想到對cookies進行處理的方法,如下所示:
1、先成功登入1次,獲取到cookies,處理為字典
2、再改送請求,requests.get(xxx, cookies=cookies)
然而requests模組為我們提供一個更加方便的方法,名為session,可以幫助我們維持客戶端和服務端的會話狀態而不斷開:
# 1、例項化session物件
session = requests.session()
# 2、讓session物件傳送get或者post請求
post_data = {'email':'','password':''}
res = session.post(url=url, data=post_data, headers=headers) # 登陸
res = session.get(url=url, headers=headers)
原理
瀏覽器原理: 訪問需要登入的頁面會帶著之前登入過的cookie
程式原理: 同樣帶著之前登入的cookie去訪問 - 由session物件完成
1、例項化session物件
2、登入網站: session物件傳送請求,登入對應網站,把cookie儲存在session物件中
3、訪問頁面: session物件請求需要登入才能訪問的頁面,session能夠自動攜帶之前的這個cookie,進行請求
selenium實現
模擬點選,再用switch_to切換網頁
相關文章
- python爬蟲如何用session保持登入?Python爬蟲Session
- 那些年,我爬過的北科(二)——爬蟲基礎之session登陸爬蟲Session
- python 爬蟲網頁登陸Python爬蟲網頁
- 利用CSP探測網站登陸狀態(alipay/baidu為例)網站AI
- 爬蟲之普通的模擬登陸爬蟲
- 爬蟲 | 處理cookie的基本方法——session爬蟲CookieSession
- Vue外賣十一:登入成功資訊顯示、瀏覽器cookie+後端session登入狀態保持Vue瀏覽器Cookie後端Session
- 爬蟲實戰(二):Selenium 模擬登入並爬取資訊爬蟲
- 爬蟲-selenium的使用爬蟲
- requests請求狀態保持-登入github為例Github
- 如何利用 Selenium 爬取評論資料?
- Python爬蟲之路-selenium在爬蟲中的使用Python爬蟲
- selenium+python設定爬蟲代理IP的方法Python爬蟲
- selenium爬蟲學習1爬蟲
- 通過session模擬登陸Session
- 爬蟲Selenium+PhantomJS爬取動態網站圖片資訊(Python)爬蟲JS網站Python
- Flutter 中如何保持Tabbar和TabbarView的狀態?FluttertabBarView
- Python爬蟲基礎之seleniumPython爬蟲
- Python 爬蟲模擬登入方法彙總Python爬蟲
- HTTP狀態保持的原理HTTP
- Selenium爬蟲遇到超時TimeOut問題的解決方法爬蟲
- PHP 會話(Session)如何實現使用者登陸功能PHP會話Session
- python+pytest介面自動化(9)-cookie繞過登入(保持登入狀態)PythonCookie
- Python爬蟲教程-26-Selenium + PhantomJSPython爬蟲JS
- 呼叫瀏覽器的爬蟲——selenium瀏覽器爬蟲
- python實現selenium網路爬蟲Python爬蟲
- 如何利用Python網路爬蟲抓取微信朋友圈的動態(上)Python爬蟲
- python利用selenium+phantomJS爬淘寶PythonJS
- 為爬蟲獲取登入cookies:使用萬能鑰匙 Selenium 搞定一切登入爬蟲Cookie
- 【開發必備】單點登入,清除了cookie,頁面還保持登入狀態?Cookie
- Python利用Selenium自動登入掘金Python
- 如何利用代理ip提高爬蟲的工作效率爬蟲
- Python爬蟲之Selenium庫的基本使用Python爬蟲
- Python網路爬蟲 - Phantomjs, selenium/Chromedirver使用Python爬蟲JSChrome
- Python爬蟲之selenium庫使用詳解Python爬蟲
- JAVA爬蟲使用Selenium自動翻頁Java爬蟲
- 04selenium爬蟲輕鬆入門爬蟲
- [python爬蟲] selenium爬取區域性動態重新整理網站(URL始終固定)Python爬蟲網站