新手使用python採集資料的尷尬事之代理ip

johnychen發表於2021-09-09


背景 , 原本不是爬蟲的,因公司業務需求需要一些前程無憂的資料,被迫上崗,簡單的學了些python。因為網站的特殊性,訪問次數多了就要封ip,意味著還要找ip。所以在網上隨便找了家代理叫億牛雲,然後跟客服溝通了下我這個小白的需求,客服跟我推介了他們家的爬蟲動態轉發代理,說適合我這樣的小白使用,使用方式比較簡單,我就抱著試試的想法接受了。客服給我發了一段關於python怎麼使用他們家代理的程式碼示例,。開啟看了之後我以為示例就是可以直接使用的,而且客服也說過程式碼示例可以直接複製使用,我就直接複製然後把目標網站改成了我自己的,程式碼如下

#! -*- encoding:utf-8 -*-

 

        import requests

        import random

 

        # 要訪問的目標頁面

        targetUrl = ""

 

        # 要訪問的目標HTTPS頁面

        # targetUrl = "https://"

 

        # 代理伺服器(產品官網 )

        proxyHost = "t.16yun.cn"

        proxyPort = "31111"

 

        # 代理隧道驗證資訊

        proxyUser = "username"

        proxyPass = "password"

 

        proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {

            "host" : proxyHost,

            "port" : proxyPort,

            "user" : proxyUser,

            "pass" : proxyPass,

        }

 

        # 設定 http和https訪問都是用HTTP代理

        proxies = {

            "http"  : proxyMeta,

            "https" : proxyMeta,

        }

 

 

        #  設定IP切換頭

        tunnel = random.randint(1,10000)

        headers = {"Proxy-Tunnel": str(tunnel)}

 

 

 

        resp = requests.get(targetUrl, proxies=proxies, headers=headers)

 

        print resp.status_code

        print resp.text

然後就去執行,結果是這樣

 

 圖片描述

然後就去找客服,結果人家說那只是程式碼示例,裡面的代理引數是需要他們提供重新配置才可以使用,頓時就覺得自己真的很小白,然後請客服開通了代理測試了下,結果執行起了,對我這樣的小白來還好使用的方式簡單,不然又要各種查資料了。我想很多人都是這樣吧,剛開始的時候各種小白問題都有可能存在,看來不管是哪個領域,還是要深入的學習才好!


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4301/viewspace-2825009/,如需轉載,請註明出處,否則將追究法律責任。

相關文章