Python Selenium如何操作Cookies

王平發表於2019-01-10

原文網址 : https://www.yuanrenxue.com/python-selenium/selenium-manage-cookies.html

PythonCookie

寫爬蟲的時候免不了操作Cookies，使用Selenium可以很方便的讀取瀏覽器已有Cookies，管理Cookies也很方便。

selenium cookies

1.selenium讀取瀏覽器已有Cookies

瀏覽器已有Cookies有一個好處是我們的真實行為，裡面儲存的資料都是我們經常使用的賬號資料，這在抓取網站時有較大好處，因為對這些老賬號，真實Cookies，被爬網站會對你的抓取行為寬鬆一些。

比如你在瀏覽器登陸和訪問過微博的話，使用selenium讀取操作老cookies，訪問微博的話，你就不需要再登陸啦。

如何操作老Cookie呢？使用add_argument()方法，看程式碼演示。拿Chrome瀏覽器舉例，程式碼在Python 3.6裡測試通過。

from selenium import webdriver

options = webdriver.ChromeOptions()
options.add_argument("user-data-dir=C:\\Users\\HN\\AppData\\Local\\Google\\Chrome\\User Data")

options.add_experimental_option("excludeSwitches",["ignore-certificate-errors"])

driver = webdriver.Chrome(executable_path="C:/chromedriver.exe",options=options)

driver.maximize_window()

driver.get('https://www.weibo.com')

print(driver.get_cookies())

add_argument()方法裡填你Chrome瀏覽器儲存Cookies的路徑。
add_experimental_option()方法是訪問https的網站，Selenium可能會報錯，使用這個方法可以忽略報錯。
get_cookies()方法可以得到當前訪問網站的Cookies。

上述例子就可以使用瀏覽器已有Cookies了，並且你後續使用Selenium的訪問操作網站記錄也會儲存在這個Cookies理。

PS：電腦記憶體不夠或已經開啟了Chrome，再用Selenium開啟一個Chrome時，可能會報：unable to move cache folder ShaderCache/GPUCache錯誤。
這時要把之前的Chrome關閉才行。

2.selenium儲存cookies

上面介紹瞭如何讀取老cookies並免登陸訪問網站，還有一種情況有些網站對單個賬號有訪問頻率限制，所以你準備了多個賬號，想要每隔一段時間換一個賬號來訪問網站。

這樣如果讓瀏覽器自己來儲存Cookies的話，會把你之前的賬戶Cookie覆蓋一部分，會導致之前的賬號訪問網站時要求你輸入賬號密碼登陸。

這種情況就要來管理Cookies，讓每個賬號都儲存在不同檔案裡，這個過程要藉助pickle庫來序列化資料(把格式資料存入檔案和載入到記憶體)。看下面例項：

#coding=utf-8
from selenium import webdriver
import pickle
import time

driver = webdriver.Chrome(executable_path="C:/chromedriver.exe")
driver.maximize_window()
driver.get('https://www.douban.com')

time.sleep(60)

cookies = driver.get_cookies()
with open('D:/test_cookies/db_cookie_1','wb') as f:
    pickle.dump(cookies,f)
print ('done')

上面示例演示通過selenium開啟豆瓣網，你要在豆瓣網上輸入賬號密碼點選登入，程式會把登入成功後的豆瓣網cookie儲存到指定資料夾下面。儲存cookies到檔案是用pickle庫的dump方法來完成的，它可以幫助你序列化資料，很方便。

上面睡眠60秒是給你足夠時間輸入賬號密碼。

接下來的程式就來呼叫我們剛才儲存的cookies來登入豆瓣。

#coding=utf-8
from selenium import webdriver
import pickle
import time

driver = webdriver.Chrome(executable_path="C:/chromedriver.exe")
#不帶cookies訪問豆瓣
driver.get('https://www.douban.com')
#刪掉cookies
driver.delete_all_cookies()

with open('D:/test_cookies/db_cookie_1','rb') as f:
    cookies = pickle.load(f)
for cookie in cookies:
    driver.add_cookie(cookie)
    print(cookie)

#帶我們儲存的cookie訪問豆瓣
driver.get('https://www.douban.com')

print('done')

是不是能夠自動登陸豆瓣了？
這裡面還是用到pickle庫的load()方法來載入cookie，使用add_cookie()方法來把儲存的cookie加入到瀏覽器裡。
注意上面的流程，先是不帶cookie訪問網站，然後把網站的cookies刪掉，把儲存的cookie加入到瀏覽器中，再重新訪問網站，這樣就能帶我們自己的cookie訪問了。

不安上面的流程，直接帶我們的cookies訪問網站，可能會失敗。

上面的兩個程式示例，就實現了把cookies按單個賬戶來儲存到我們指定的資料夾中，不同的賬戶，你只需要按不同的賬戶名來儲存檔案就，這樣方便管理。以後就可以實現切換不用的賬戶來訪問網站。

3.Selenium操作cookies總結

回顧一下，新增cookie的方法是add_cookie()，一般一個網站會有多個cookie，所以需要按上面的方法迴圈把cookie都加入。

另外刪除cookies的方法是delete_all_cookies()

還有使用Selenium操作瀏覽器，如果你退出程式時不儲存cookies，那cookies是不會被儲存到檔案的。

我的公眾號：猿人學 Python 上會分享更多心得體會，敬請關注。

***版權申明:若沒有特殊說明，文章皆是猿人學 yuanrenxue.com 原創，沒有猿人學授權，請勿以任何形式轉載。***

Python_Selenium的等待操作
2022-07-25
Python
Python Selenium操作Cookie的方法
2021-09-11
PythonCookie
selenium+python 操作滾動條
2018-08-03
Python
Python Selenium keys快捷鍵和鍵盤操作
2019-01-16
Python
Python Selenium如何定位元素
2019-01-06
Python
python+selenium 通過新增cookies或token解決網頁上驗證碼登入問題
2018-07-27
PythonCookie網頁
selenium 鍵盤操作
2018-09-06
Selenium的等待操作
2024-06-26
selenium自動化操作
2020-06-21
Python如何操作MySQL
2019-02-16
PythonMySql
python如何操作socketserver
2021-09-11
PythonServer
python selenium Demo
2024-03-15
Python
Cookies
2020-05-30
Cookie
python request 獲取cookies value值的方法
2018-05-25
PythonCookie
selenium定位與常見操作
2020-10-28
python+selenium實現動態爬取及selenuim的常用操作
2018-11-22
PythonUI
python+selenium+unittest+page object 如何部署到 jenkins？
2020-10-23
PythonObjectJenkins
Python Selenium簡介
2018-12-21
Python
Python之Selenium 框架
2019-10-14
Python框架
Python 中 selenium 庫
2022-02-28
Python
Python爬蟲進階之會話和Cookies
2021-09-11
Python爬蟲會話Cookie
Cypress系列（90）- Cypress.Cookies 命令詳解以及如何跨測試用例共享 Cookies
2020-11-24
Cookie
Selenium4+Python3系列（九） - 上傳檔案及捲軸操作
2022-11-26
Python
【python+selenium的web自動化】- 元素的常用操作詳解(一)
2021-03-12
PythonWeb
Selenium操作：測試form表單
2024-10-15
ORM
18 Python如何操作檔案？
2024-09-10
Python
如何用python pandas操作excel?
2021-09-11
PythonExcel
『心善淵』Selenium3.0基礎 — 13、Selenium操作下拉選單
2021-07-03
python selenium 速查筆記
2024-04-02
Python筆記
python+selenium方法大全
2021-01-19
Python
Another Intro for Cookies
2021-12-14
Cookie
如何使用PYTHON操作攝像頭
2020-03-09
Python
為爬蟲獲取登入cookies：使用萬能鑰匙 Selenium 搞定一切登入
2018-12-03
爬蟲Cookie
【python+selenium的web自動化】- 針對上傳操作的實現方案
2021-03-15
PythonWeb
『心善淵』Selenium3.0基礎 — 12、Selenium操作滑鼠和鍵盤事件
2021-07-02
事件
『心善淵』Selenium3.0基礎 — 16、Selenium對iframe表單的操作
2021-07-04
Selenium–資料驅動(python)
2018-05-18
Python
python+selenium 儲存log
2018-08-07
Python

Python Selenium如何操作Cookies

1.selenium讀取瀏覽器已有Cookies

2.selenium儲存cookies

3.Selenium操作cookies總結

相關文章