爬蟲中的TCP請求自動切換ip
作為爬蟲工作者,在日常採集資料的過程中我們會遇到需要使用tcp請求,並且每個TCP請求自動切換ip,意思是指爬蟲代理為爬蟲程式發出的每個TCP請求隨機提供一個代理IP,同一個TCP會話中IP不變。在遇到需要這樣的情況下我們可以透過設定Proxy-Connection: Keep-Alive或Connection: Keep-Alive可以保持同一個Session代理IP不變。
在目標網站需要登入,獲取資料的兩個請求在一個IP下,只需保證該組請求在一個TCP(Keep-Alive)會話下, 該組請求在代理有效期內使用相同的代理IP。程式碼參考如下:
#! -*- encoding:utf-8 -*- import requests import random import requests.adapters # 要訪問的目標頁面 targetUrlList = [ "", "", "", ] # 代理伺服器(產品官網 ) proxyHost = "t.16yun.cn" proxyPort = "31111" # 代理驗證資訊 proxyUser = "username" proxyPass = "password" proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % { "host": proxyHost, "port": proxyPort, "user": proxyUser, "pass": proxyPass, } # 設定 http和https訪問都是用HTTP代理 proxies = { "http": proxyMeta, "https": proxyMeta, } # 訪問三次網站,使用相同的Session(keep-alive), 均能夠保持相同的外網IP s = requests.session() # 設定cookie # cookie_dict = {"JSESSION":"123456789"} # cookies = requests.utils.cookiejar_from_dict(cookie_dict, cookiejar=None, overwrite=True) # s.cookies = cookies for i in range(3): for url in targetUrlList: r = s.get(url, proxies=proxies) print r.text
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/1978/viewspace-2797909/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- Python網路爬蟲進階:自動切換HTTP代理IP的應用Python爬蟲HTTP
- python 爬蟲 自動切換 learnku 的白天 / 夜間模式Python爬蟲模式
- python爬蟲請求頭Python爬蟲
- 爬蟲代理IP自動分配失敗的原因爬蟲
- 使用海外HTTP代理爬蟲時,我們該如何快速切換IP?HTTP爬蟲
- 爬蟲中網路請求的那些事之urllib庫爬蟲
- Python爬蟲(二)——傳送請求Python爬蟲
- scan ip的手動切換
- 爬蟲快速入門——Get請求的使用爬蟲
- Python爬蟲基礎-01-帶有請求引數的爬蟲Python爬蟲
- Requests如何在Python爬蟲中實現get請求?Python爬蟲
- 爬蟲 | 非同步請求aiohttp模組爬蟲非同步AIHTTP
- 爬蟲為什麼要用IP代理更換IP地址爬蟲
- 【0基礎學爬蟲】爬蟲基礎之網路請求庫的使用爬蟲
- 爬蟲學習日記(十)selenium frame的切換爬蟲
- 【爬蟲】第二章-基本請求庫爬蟲
- 4.爬蟲 requests庫講解 GET請求 POST請求 響應爬蟲
- 動態換ip軟體帶你看:爬蟲常見的抓取策略爬蟲
- TCP 請求頭TCP
- Python爬蟲Post請求返回值為-1000Python爬蟲
- 爬蟲:HTTP請求與HTML解析(爬取某乎網站)爬蟲HTTPHTML網站
- 實用爬蟲-01-檢測爬蟲的 IP爬蟲
- Vue路由切換 & Axios介面取消重複請求Vue路由iOS
- Python爬蟲動態ip代理防止被封的方法Python爬蟲
- 獲取爬蟲動態IP的三種方法爬蟲
- 利用post請求傳送內容進行爬蟲爬蟲
- 爬蟲代理IP的使用技巧爬蟲
- MySQL Orchestrator自動導換+VIP切換MySql
- Python網路爬蟲第三彈《爬取get請求的頁面資料》Python爬蟲
- IP地址切換工具
- 匿名IP在網路爬蟲中的應用探索爬蟲
- Java爬蟲系列四:使用selenium-java爬取js非同步請求的資料Java爬蟲JS非同步
- 如何建立爬蟲IP池?爬蟲
- axios的post請求爬坑iOS
- 【0基礎學爬蟲】爬蟲基礎之自動化工具 Pyppeteer 的使用爬蟲
- 【0基礎學爬蟲】爬蟲基礎之自動化工具 Playwright 的使用爬蟲
- 【0基礎學爬蟲】爬蟲基礎之自動化工具 Selenium 的使用爬蟲
- 爬蟲動態http代理ip有什麼功能爬蟲HTTP