python 代理在爬蟲中的作用
代理:偽裝IP,破解封IP這種反爬機制。
說明是代理:
- :代理伺服器:網路資訊的中轉站
代理的作用: - 突破自身IP訪問的限制
- 隱藏自身真實IP。
代理IP型別: - http: 應用到http協議對應的url協議中
- https:應用到https協議對應的url協議中
搜尋ip點選百度一下,發起請求的IP就是本機IP,然後這裡就顯示出來、如果發起請求頻率過大,可能會被封。
如果用代理伺服器發起請求,則百度顯示的IP就是代理伺服器的IP。
import requests
if __name__ == '__main__':
url = 'https://www.baidu.com/s?wd=ip'
headers ={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.80 Safari/537.36 Edg/86.0.622.43'
}
page_text = requests.get(url=url,headers=headers).text
with open('./ip.html','w',encoding='utf-8') as fp:
fp.write(page_text)
顯示的IP是本機IP。
page_text = requests.get(url=url,headers=headers,proxies={'https':'171.35.146.108:9999'}).text
在requests.get里加入引數proxies
,是一個字典,key為https或http,value為ID
代理IP匿名度:
- 透明:意味著伺服器知道該次請求使用了代理,也知道請求對應真實IP
- 匿名:知道使用了代理但不知道本機IP
- 高匿名:不知道以上兩個
相關文章
- Python爬蟲之路-chrome在爬蟲中的使用Python爬蟲Chrome
- Python爬蟲之路-selenium在爬蟲中的使用Python爬蟲
- 爬蟲代理IP的三大作用爬蟲
- python 爬蟲 代理池Python爬蟲
- python和爬蟲代理的關聯Python爬蟲
- python爬蟲實戰:爬取西刺代理的代理ip(二)Python爬蟲
- Python代理IP爬蟲的簡單使用Python爬蟲
- Python 爬蟲IP代理池的實現Python爬蟲
- 用Python爬蟲抓取代理IPPython爬蟲
- Python爬蟲技巧---設定代理IPPython爬蟲
- python爬蟲進階必備之代理Python爬蟲
- selenium+python設定爬蟲代理IP的方法Python爬蟲
- Python爬蟲動態ip代理防止被封的方法Python爬蟲
- Python爬蟲需要了解的代理IP知識Python爬蟲
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- 爬蟲使用http代理有什麼作用?該怎麼選擇http代理?爬蟲HTTP
- Python爬蟲怎麼設定動態IP代理,Python爬蟲要注意哪些事項?Python爬蟲
- 如何用海外HTTP代理設定python爬蟲代理ip池?HTTPPython爬蟲
- python爬蟲利用requests製作代理池sPython爬蟲
- Python爬蟲工作對代理IP有哪些需求?Python爬蟲
- 代理IP幫助Python爬蟲分析市場Python爬蟲
- python爬蟲利用代理IP分析大資料Python爬蟲大資料
- Python爬蟲進階之代理的基本原理Python爬蟲
- scrapy爬蟲代理池爬蟲
- 爬蟲代理IP的使用技巧爬蟲
- Python爬蟲可以幹什麼?有什麼作用?Python爬蟲
- python爬蟲之反爬蟲(隨機user-agent,獲取代理ip,檢測代理ip可用性)Python爬蟲隨機
- python爬蟲ip代理伺服器的簡要思路-VeCloudPython爬蟲伺服器Cloud
- Java爬蟲與Python爬蟲的區別?Java爬蟲Python
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- python就是爬蟲嗎-python就是爬蟲嗎Python爬蟲
- 爬蟲代理是如何執行的?爬蟲
- 使用住宅代理去爬蟲的原因爬蟲
- 爬蟲代理怎麼用爬蟲
- 爬蟲使用代理是否安全爬蟲
- 如何利用ip住宅代理解決python爬蟲遇到反爬措施的問題?Python爬蟲
- Python爬蟲的用途Python爬蟲
- python 爬蟲Python爬蟲