Python爬蟲教程-09-error模組
今天的主角是error,爬取的時候,很容易出現錯,所以我們要在程式碼裡做一些,常見錯誤的處,關於urllib.error
URLError
- URLError 產生的原因:
- 1.無網路連線
- 2.伺服器連線失敗
- 3.找不到指定的伺服器
- 4.URLError是OSError的子類
- 案例v9檔案:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py09error.py
# 案例v9
# URLError的使用
from urllib import request,error
if __name__ == '__main__':
url = "http://www.baiiiiiiiiiiidu.com/"
try:
req = request.Request(url)
rsp = request.urlopen(req)
html = rsp.read().decode()
print(html)
except error.URLError as e:
print("URLError:{0}".format(e.reason))
print("URLError:{0}".format(e))
except Exception as e:
print(e)
HTTPError
- 1.是URLError的一個子類
URLError和HTTPError的區別:
- HTTPError是對應的HTTP請求的返回碼錯誤,如果返回錯誤碼是400以上的,則引發HTTPError
- URLError對應的一般是網路出現問題,包括url問題
更多文章連結:Python 爬蟲隨筆
- 本筆記不允許任何個人和組織轉載