爬蟲如何利用session方法保持登陸狀態(selenium)

藍色櫻桃發表於2020-11-12

原文網址 : https://blog.csdn.net/github_38289199/article/details/109635242

爬取網站頁面時需要登入後才能訪問，否則獲取不到頁面的實際響應資料

有些網站需要我們登陸才能獲取訪問資料，然而往往登陸頁和所要爬取的資料不在同一頁面，這裡一般都會想到對cookies進行處理的方法，如下所示：

   1、先成功登入1次,獲取到cookies,處理為字典
   2、再改送請求，requests.get(xxx,　cookies=cookies)

然而requests模組為我們提供一個更加方便的方法，名為session，可以幫助我們維持客戶端和服務端的會話狀態而不斷開：

	#　1、例項化session物件
   		session = requests.session()
   		
	# 2、讓session物件傳送get或者post請求
		post_data = {'email':'','password':''}
  	 	res = session.post(url=url,　data=post_data,　headers=headers)	＃　登陸
  		res = session.get(url=url,　headers=headers)

原理

瀏覽器原理: 訪問需要登入的頁面會帶著之前登入過的cookie
程式原理: 同樣帶著之前登入的cookie去訪問 - 由session物件完成
1、例項化session物件
2、登入網站: session物件傳送請求,登入對應網站,把cookie儲存在session物件中
3、訪問頁面: session物件請求需要登入才能訪問的頁面,session能夠自動攜帶之前的這個cookie,進行請求

selenium實現

模擬點選，再用switch_to切換網頁

python爬蟲如何用session保持登入?
2021-09-11
Python爬蟲Session
那些年，我爬過的北科(二)——爬蟲基礎之session登陸
2018-12-08
爬蟲Session
python 爬蟲網頁登陸
2020-11-30
Python爬蟲網頁
利用CSP探測網站登陸狀態（alipay/baidu為例）
2020-08-19
網站AI
爬蟲之普通的模擬登陸
2018-08-24
爬蟲
爬蟲 | 處理cookie的基本方法——session
2024-06-12
爬蟲CookieSession
Vue外賣十一：登入成功資訊顯示、瀏覽器cookie+後端session登入狀態保持
2020-12-01
Vue瀏覽器Cookie後端Session
爬蟲-selenium的使用
2021-02-04
爬蟲
爬蟲實戰（二）：Selenium 模擬登入並爬取資訊
2018-07-15
爬蟲
requests請求狀態保持-登入github為例
2018-06-20
Github
如何利用 Selenium 爬取評論資料？
2018-04-12
Python爬蟲之路-selenium在爬蟲中的使用
2021-01-04
Python爬蟲
selenium+python設定爬蟲代理IP的方法
2019-04-17
Python爬蟲
selenium爬蟲學習1
2024-08-29
爬蟲
通過session模擬登陸
2019-01-13
Session
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
Flutter 中如何保持Tabbar和TabbarView的狀態？
2021-05-18
FluttertabBarView
Python爬蟲基礎之selenium
2022-07-13
Python爬蟲
Python 爬蟲模擬登入方法彙總
2018-10-29
Python爬蟲
HTTP狀態保持的原理
2018-07-13
HTTP
Selenium爬蟲遇到超時TimeOut問題的解決方法
2018-12-06
爬蟲
PHP 會話(Session)如何實現使用者登陸功能
2020-04-25
PHP會話Session
python+pytest介面自動化(9)-cookie繞過登入(保持登入狀態)
2022-03-21
PythonCookie
Python爬蟲教程-26-Selenium + PhantomJS
2018-09-06
Python爬蟲JS
呼叫瀏覽器的爬蟲——selenium
2020-03-27
瀏覽器爬蟲
python實現selenium網路爬蟲
2021-03-11
Python爬蟲
如何利用Python網路爬蟲抓取微信朋友圈的動態（上）
2018-05-09
Python爬蟲
python利用selenium+phantomJS爬淘寶
2018-06-02
PythonJS
為爬蟲獲取登入cookies：使用萬能鑰匙 Selenium 搞定一切登入
2018-12-03
爬蟲Cookie
【開發必備】單點登入，清除了cookie，頁面還保持登入狀態？
2022-12-01
Cookie
Python利用Selenium自動登入掘金
2018-09-02
Python
如何利用代理ip提高爬蟲的工作效率
2021-09-11
爬蟲
Python爬蟲之Selenium庫的基本使用
2018-11-30
Python爬蟲
Python網路爬蟲 - Phantomjs, selenium/Chromedirver使用
2019-01-22
Python爬蟲JSChrome
Python爬蟲之selenium庫使用詳解
2018-05-16
Python爬蟲
JAVA爬蟲使用Selenium自動翻頁
2024-05-15
Java爬蟲
04selenium爬蟲輕鬆入門
2024-12-08
爬蟲
[python爬蟲] selenium爬取區域性動態重新整理網站（URL始終固定）
2018-04-26
Python爬蟲網站

爬蟲如何利用session方法保持登陸狀態(selenium)

原理

selenium實現

相關文章