爬蟲常見錯誤程式碼及解決措施
一些 使用者反映在爬蟲的過程中,使用了代理IP但是依舊出現請求失敗的情況 。 如果爬蟲使用不當或者用了 質量較低 的代理IP都 可能 會導致上述情況的發生。 以下是一些 使用代理IP時常見的報錯及原因 :
1 、 錯誤程式碼401 (未授權)
當錯誤程式碼為401 時,網頁會 先 請求身份驗證 , 這種錯誤 一般是 在需要登入賬號密碼來訪問網頁時發生 。 當 使用者 在使用代理IP 瀏覽器訪問時,會轉跳到一個有賬號密碼登入的視窗。 如果 發生這種錯誤, 是由於在 使用代理IP 錢 沒有授權白名單IP , 或是 沒有繫結固定的IP 授權, 此時應該 再次去繫結授權白名單IP ,並重新進入。
2 、 錯誤程式碼403 (禁止)
此 錯誤程式碼是爬蟲使用者遇見多的程式碼,它 意味 著伺服器拒絕了 使用者 的請求。 出現的原因一 般是 有欲 爬蟲抓取的頻率太大,在反覆高速訪問頁面時給目標伺服器帶來了過大的壓力,導致伺服器判定爬蟲使用者的IP 為非正常訪問,從而禁止 了 爬蟲使用者的IP 。這種時候爬蟲使用者 可以通過更換新的 IP 地址來 解決 。
品易雲全球HTTP 已向多知名網站提供服務,支援 API 批量使用,支援多執行緒高併發使用。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015981/viewspace-2894883/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 爬蟲使用海外HTTP代理時常見的錯誤程式碼及解決方法爬蟲HTTP
- 常見網站反爬蟲的解決措施網站爬蟲
- 爬蟲常見問題及解決方式爬蟲
- 爬蟲錯誤程式碼如何解決?爬蟲
- Hadoop常見錯誤及解決方案Hadoop
- 使用代理爬蟲出302錯誤程式碼解決方法爬蟲
- 常見的三種反爬蟲措施爬蟲
- 海外常見的http錯誤程式碼原因與解決HTTP
- 派克斯常見錯誤程式碼詳解
- Elasticsearch常見的5個錯誤及解決策略Elasticsearch
- Python爬蟲程式設計常見問題解決方法Python爬蟲程式設計
- 常見 HTTP 錯誤程式碼大全HTTP
- SSL證書7大常見錯誤及解決方法!
- 中科三方——SSL常見錯誤及解決方法
- 常見的反爬蟲措施與應對方法介紹爬蟲
- SSL證書七大常見錯誤及解決方法
- Go常見錯誤集錦 | 字串底層原理及常見錯誤Go字串
- Go 常見錯誤集錦 | 字串底層原理及常見錯誤Go字串
- Tomcat常見異常及解決方案程式碼例項Tomcat
- MySQL 主從複製,常見的binlog錯誤及解決方法MySql
- 代理IP常見錯誤程式碼介紹
- PHP編譯安裝時常見錯誤解決辦法,php編譯常見錯誤PHP編譯
- 恆創科技:網站401錯誤的常見原因及解決方法網站
- 常見的授權錯誤及原因
- 使用代理時常見的錯誤程式碼有哪些?
- 【常見錯誤】--Nltk使用錯誤
- 帝國CMS搬家常見錯誤及解決方法
- SSH常見錯誤
- MySQL 常見錯誤MySql
- 伺服器出現 HTTP 錯誤程式碼,及解決方法伺服器HTTP
- 常見DB2的錯誤的報告程式碼DB2
- IBM WebSphere Portal當機或效能低常見問題分析 及解決措施IBMWeb
- 總結一篇shell除錯技巧及常見的指令碼錯誤除錯指令碼
- 網站常見反爬解決方法網站
- 【彙總】Python語言常見報錯及解決方案!Python
- 建議收藏備查!MySQL 常見錯誤程式碼說明MySql
- 爬蟲抓取網站有什麼技巧,要如何避免錯誤程式碼?爬蟲網站
- Mysql:1236常見錯誤MySql