新手使用python採集資料的尷尬事之代理ip
背景 , 原本不是爬蟲的,因公司業務需求需要一些前程無憂的資料,被迫上崗,簡單的學了些python。因為網站的特殊性,訪問次數多了就要封ip,意味著還要找ip。所以在網上隨便找了家代理叫億牛雲,然後跟客服溝通了下我這個小白的需求,客服跟我推介了他們家的爬蟲動態轉發代理,說適合我這樣的小白使用,使用方式比較簡單,我就抱著試試的想法接受了。客服給我發了一段關於python怎麼使用他們家代理的程式碼示例,。開啟看了之後我以為示例就是可以直接使用的,而且客服也說過程式碼示例可以直接複製使用,我就直接複製然後把目標網站改成了我自己的,程式碼如下
#! -*- encoding:utf-8 -*-
import requests
import random
# 要訪問的目標頁面
targetUrl = ""
# 要訪問的目標HTTPS頁面
# targetUrl = "https://"
# 代理伺服器(產品官網 )
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理隧道驗證資訊
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 設定 http和https訪問都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 設定IP切換頭
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
然後就去執行,結果是這樣
然後就去找客服,結果人家說那只是程式碼示例,裡面的代理引數是需要他們提供重新配置才可以使用,頓時就覺得自己真的很小白,然後請客服開通了代理測試了下,結果執行起了,對我這樣的小白來還好使用的方式簡單,不然又要各種查資料了。我想很多人都是這樣吧,剛開始的時候各種小白問題都有可能存在,看來不管是哪個領域,還是要深入的學習才好!
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4301/viewspace-2825009/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 代理IP對金融資料採集的作用
- 資料採集爬蟲ip代理基本原理爬蟲
- Python基於scrapy採集資料時使用代理伺服器的方法Python伺服器
- 文章採集代理ip怎麼用?
- Python進行資料採集時,如何避免IP被封?Python
- 業務測開的尷尬定位
- ip代理軟體的使用注意事項
- 尷尬的遊戲使用者體驗設計師遊戲
- 爬蟲採集自建代理ip池的三大優勢爬蟲
- 爬蟲採集對於代理IP的五大需求爬蟲
- 光線傳媒的爆款尷尬
- 軟體測試工程師的尷尬工程師
- 記錄一件很尷尬的事,中介軟體給我的痛。
- Python爬蟲抓取資料,為什麼要使用代理IP?Python爬蟲
- Python代理IP的使用和代理池的設定Python
- python爬蟲 之 scrapy框架採集2000期彩票資料Python爬蟲框架
- 大資料技術之資料採集篇大資料
- python爬蟲利用代理IP分析大資料Python爬蟲大資料
- Xbox的日進之路,微軟的尷尬困局微軟
- Python代理IP爬蟲的簡單使用Python爬蟲
- 爬蟲筆記:提高資料採集效率!代理池和執行緒池的使用爬蟲筆記執行緒
- 使用代理IP抓取資料的四大優勢
- 使用Python爬取代理資料Python
- 使用代理IP時,有什麼注意事項?
- 在Python中使用代理IP的方法詳解Python
- 資料採集與分析的那些事——從資料埋點到AB測試
- 【python爬蟲實戰】使用Selenium webdriver採集山東招考資料Python爬蟲Web
- 如何擺脫專案命名困難的尷尬局面
- 記一次尷尬的評論翻車事件事件
- 蒂姆.威爾茨:處境尷尬的 DooM 元老OOM
- 在尷尬中進行的數字化轉型
- 使用代理IP抓取資料需要注意什麼?
- 使用代理ip的原因
- 三星迷之尷尬,升級系統的手機不相容GearVRVR
- 【Python資料採集】國家自然科學基金大資料知識管理服務門戶資料採集Python大資料
- 如何正確的使用代理ip資源
- Scrapy爬蟲框架如何使用代理進行採集爬蟲框架
- 分散式監控系統之Zabbix 使用SNMP、JMX通道採集資料分散式