python爬蟲如何用session保持登入?

lightwing發表於2021-09-11

python爬蟲如何用session保持登入?

在採集資料的前期,我們需要為爬蟲準備一個登入的程式碼,而且要一直保持登入,才不會被網站識別出來。這兩天我們也介紹了不少的方法,但是本次我們需要達到一直保持登入的這個條件,小夥伴們有沒有其他的方法能夠滿足條件呢?小編在學習的時候接觸到了session,發現它可以讓賬戶處於一直登陸的狀態下,接下來我們一起學習session的用法吧。


有很多python的方法可以實現登陸網頁,但是如果需要保持登陸條件下使用網頁的某些功能,則一般需要利用cookie。在所有的實現方法中,Request包是一種相對比較簡潔的方法。

import request


找到目標網頁的登陸頁面,在瀏覽器中用右鍵點選使用者名稱和密碼區域“檢視網頁原始碼”。在高亮的程式碼中找name對應的值,通常是"username", "password"。在這個例子中是"email-login" 和"password-login"。

python爬蟲如何用session保持登入?

 

接下來的在程式碼中建立一個session,保持登陸狀態

s = Session()
s = session.post("登陸頁面的url",
             
                      'email-login': “使用者名稱”,
                      'password': “密碼”,
                      #'Token': "某些網站需要token,可以在這裡新增"
 
                  }


之後可以繼續利用s 這個session來爬取網頁內容或者利用api下載文件。

只要確保完成session的建立,我們的賬戶就會一直處於登陸狀態,當然爬蟲也可以繼續收集資料啦。有很多資料想要採集,但苦惱於賬號不能一直保持登入的可以試試session的方法。更多Python學習指路:

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/3407/viewspace-2831950/,如需轉載,請註明出處,否則將追究法律責任。

相關文章