Spider-04-response簡介
本小節介紹urlopen的返回物件,和簡單除錯方法
案例v3
- 研究request的返回值,輸出返回值型別,列印內容
- geturl:返回請求物件的url
- info:請求返回物件的meta資訊
- getcode:返回的http code
- py04v3.py檔案:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py04v3.py
# py04v3.py
from urllib import request
if __name__ == '__main__':
url = 'https://jobs.zhaopin.com/CC375882789J00033399409.htm'
rsp = request.urlopen(url)
# 按住Ctrl鍵不送,同時點選urlopen,可以檢視文件,有函式的具體引數和使用方法
print("rsp的型別:{0}".format(type(rsp)))
print("rsp的內容:{0}".format(rsp))
print("url為:{0}".format(rsp.geturl()))
print("Info為:{0}".format(rsp.info()))
print("Code為:{0}".format(rsp.getcode()))
html = rsp.read()
右鍵執行,截圖如下
關於除錯
- 在程式碼左側【行號】上單擊,出現紅點,及斷點
- 右鍵【Debug '專案名'】
控制檯截圖如下
包括請求過程中的引數
urlopen的返回物件,和簡單除錯方法就介紹到這裡了
更多文章連結:Python 爬蟲隨筆
- 本筆記不允許任何個人和組織轉載