爬蟲常見錯誤程式碼及解決措施
一些 使用者反映在爬蟲的過程中,使用了代理IP但是依舊出現請求失敗的情況 。 如果爬蟲使用不當或者用了 質量較低 的代理IP都 可能 會導致上述情況的發生。 以下是一些 使用代理IP時常見的報錯及原因 :
1 、 錯誤程式碼401 (未授權)
當錯誤程式碼為401 時,網頁會 先 請求身份驗證 , 這種錯誤 一般是 在需要登入賬號密碼來訪問網頁時發生 。 當 使用者 在使用代理IP 瀏覽器訪問時,會轉跳到一個有賬號密碼登入的視窗。 如果 發生這種錯誤, 是由於在 使用代理IP 錢 沒有授權白名單IP , 或是 沒有繫結固定的IP 授權, 此時應該 再次去繫結授權白名單IP ,並重新進入。
2 、 錯誤程式碼403 (禁止)
此 錯誤程式碼是爬蟲使用者遇見多的程式碼,它 意味 著伺服器拒絕了 使用者 的請求。 出現的原因一 般是 有欲 爬蟲抓取的頻率太大,在反覆高速訪問頁面時給目標伺服器帶來了過大的壓力,導致伺服器判定爬蟲使用者的IP 為非正常訪問,從而禁止 了 爬蟲使用者的IP 。這種時候爬蟲使用者 可以通過更換新的 IP 地址來 解決 。
品易雲全球HTTP 已向多知名網站提供服務,支援 API 批量使用,支援多執行緒高併發使用。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70015981/viewspace-2894883/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 爬蟲使用海外HTTP代理時常見的錯誤程式碼及解決方法爬蟲HTTP
- 常見網站反爬蟲的解決措施網站爬蟲
- 爬蟲常見問題及解決方式爬蟲
- 爬蟲錯誤程式碼如何解決?爬蟲
- 常見的三種反爬蟲措施爬蟲
- 爬蟲專案常見問題及解決方案爬蟲
- Hadoop常見錯誤及解決方案Hadoop
- 開發常見錯誤及解決方案
- MySQL常見錯誤程式碼及程式碼說明MySql
- 海外常見的http錯誤程式碼原因與解決HTTP
- ORACLE常見錯誤程式碼的分析與解決(轉)Oracle
- 使用代理爬蟲出302錯誤程式碼解決方法爬蟲
- 派克斯常見錯誤程式碼詳解
- Elasticsearch常見的5個錯誤及解決策略Elasticsearch
- MySQL資料庫常見錯誤及解決方案MySql資料庫
- Oracle 常見的錯誤問題及解決方法Oracle
- Python爬蟲程式設計常見問題解決方法Python爬蟲程式設計
- 常見的反爬蟲措施與應對方法介紹爬蟲
- Web程式設計師常見的5個錯誤及解決方案Web程式設計師
- 中科三方——SSL常見錯誤及解決方法
- SSL證書7大常見錯誤及解決方法!
- 常見 HTTP 錯誤程式碼大全HTTP
- MySql 常見錯誤程式碼大全MySql
- SSL證書七大常見錯誤及解決方法
- Go 常見錯誤集錦 | 字串底層原理及常見錯誤Go字串
- Go常見錯誤集錦 | 字串底層原理及常見錯誤Go字串
- 9種常見的Android開發錯誤及解決方案Android
- Tomcat常見異常及解決方案程式碼例項Tomcat
- PHP編譯安裝時常見錯誤解決辦法,php編譯常見錯誤PHP編譯
- 代理IP常見錯誤程式碼介紹
- 9個常見的Android開發錯誤及解決辦法Android
- MySQL 主從複製,常見的binlog錯誤及解決方法MySql
- 菜鳥調錯(六)——Hibernate 4.3.x 註解常見錯誤及解決方案
- 常見python爬蟲框架Python爬蟲框架
- MySQL常見錯誤分析與解決方法總結MySql
- 常見的80004005錯誤及其解決方法 (轉)
- 恆創科技:網站401錯誤的常見原因及解決方法網站
- 常見的授權錯誤及原因