python爬蟲之Scrapy 使用代理配置

pythontab發表於2014-03-26

在爬取網站內容的時候，最常遇到的問題是：網站對IP有限制，會有防抓取功能，最好的辦法就是IP輪換抓取（加代理）

下面來說一下Scrapy如何配置代理，進行抓取

1.在Scrapy工程下新建“middlewares.py”

# Importing base64 library because we'll need it ONLY in case if the proxy we are going to use requires authentication
import base64 
# Start your middleware class
class ProxyMiddleware(object):
    # overwrite process request
    def process_request(self, request, spider):
        # Set the location of the proxy
        request.meta['proxy'] = "http://YOUR_PROXY_IP:PORT"
 
        # Use the following lines if your proxy requires authentication
        proxy_user_pass = "USERNAME:PASSWORD"
        # setup basic authentication for the proxy
        encoded_user_pass = base64.encodestring(proxy_user_pass)
        request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass

2.在專案配置檔案裡(./pythontab/settings.py)新增

DOWNLOADER_MIDDLEWARES = {
    'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110,
    'pythontab.middlewares.ProxyMiddleware': 100,
}

Scrapy使用入門及爬蟲代理配置
2020-11-11
爬蟲
scrapy爬蟲代理池
2018-08-28
爬蟲
python網路爬蟲（14）使用Scrapy搭建爬蟲框架
2019-07-27
Python爬蟲框架
Scrapy爬蟲框架如何使用代理進行採集
2022-02-22
爬蟲框架
python爬蟲Scrapy框架
2018-11-21
Python爬蟲框架
【Python篇】scrapy爬蟲
2020-11-29
Python爬蟲
Python爬蟲—Scrapy框架
2020-10-04
Python爬蟲框架
萬能除錯 | Python爬蟲Scrapy框架HTTP代理的配置與除錯
2022-12-14
除錯Python爬蟲框架HTTP
Python Scrapy 爬蟲（二）：scrapy 初試
2018-08-13
Python爬蟲
Scrapy之"並行"爬蟲
2017-11-29
並行爬蟲
學好Python不加班系列之SCRAPY爬蟲框架的使用
2021-11-09
Python爬蟲框架
爬蟲框架-scrapy的使用
2021-04-28
爬蟲框架
Scrapy爬蟲框架的使用
2021-01-17
爬蟲框架
Scrapy框架的使用之Scrapy通用爬蟲
2018-05-21
框架爬蟲
Python爬蟲之Scrapy學習（基礎篇）
2019-03-04
Python爬蟲
scrapy爬蟲
2012-05-09
爬蟲
爬蟲代理 Scrapy 框架詳細介紹 2
2020-06-04
爬蟲框架
爬蟲--Scrapy簡易爬蟲
2020-10-07
爬蟲
Python爬蟲教程-33-scrapy shell 的使用
2018-09-06
Python爬蟲
Python爬蟲 --- 2.3 Scrapy 框架的簡單使用
2018-12-19
Python爬蟲框架
Python爬蟲教程-30-Scrapy 爬蟲框架介紹
2018-09-06
Python爬蟲框架
Python scrapy爬蟲框架簡介
2017-04-06
Python爬蟲框架
Windows下安裝配置爬蟲工具Scrapy及爬蟲環境
2018-09-19
Windows爬蟲
爬蟲學習之基於Scrapy的網路爬蟲
2016-07-13
爬蟲
Scrapy爬蟲-草稿
2018-09-08
爬蟲
Scrapy爬蟲框架
2024-11-13
爬蟲框架
python爬蟲進階必備之代理
2021-12-23
Python爬蟲
使用python的scrapy來編寫一個爬蟲
2019-03-14
Python爬蟲
python 爬蟲代理池
2019-03-09
Python爬蟲
Python爬蟲代理池
2016-12-09
Python爬蟲
Python爬蟲教程-31-建立 Scrapy 爬蟲框架專案
2018-09-04
Python爬蟲框架
Python 爬蟲（六）：使用 Scrapy 爬取去哪兒網景區資訊
2019-10-20
Python爬蟲
Python爬蟲實戰-使用Scrapy框架爬取土巴兔(一)
2017-03-18
Python爬蟲框架
Python網路爬蟲（六） Scrapy框架
2018-01-16
Python爬蟲框架
Python 爬蟲 (六) -- Scrapy 框架學習
2017-08-28
Python爬蟲框架
使用scrapy搭建大型爬蟲系統
2017-01-15
爬蟲
Python代理IP爬蟲的簡單使用
2019-03-04
Python爬蟲
Python爬蟲使用代理proxy抓取網頁
2016-11-01
Python爬蟲網頁

python爬蟲之Scrapy 使用代理配置

相關文章