scrapy 中的 headers，Resquest，response

lizhiqiang666發表於2020-06-03

原文網址 : https://learnku.com/articles/45433

1.為了讓程式請求模仿的更像瀏覽器，需要在headers請求頭上新增一些引數

2.headers請求頭的部分重要引數：
Host (主機和埠號)
Connection (連結型別)
Upgrade-Insecure-Requests (升級為HTTPS請求)
User-Agent (瀏覽器名稱)
Accept (傳輸檔案型別)
Referer (頁面跳轉處)
Accept-Encoding（檔案編解碼格式）
Cookie （Cookie）
x-requested-with :XMLHttpRequest (是Ajax 非同步請求)

3.# 請求一個url,建立了一個Request物件
scrapy.Resquest(
url,
callback=xxx,
headers=xxx
)

3.scrapy的Resquest物件具有的例項屬性
這些引數為None時(建立Request物件未傳入)，會使用配置中預設的引數
def init(self, url, callback=None, method=’GET’, headers=None, body=None,
cookies=None, meta=None, encoding=’utf-8’, priority=0,
dont_filter=False, errback=None, flags=None):
1.headers為None時採用預設的請求頭資訊
預設的請求頭資訊在配置檔案中(可以在這裡開啟註釋修改請求頭,也可以在建立Request物件時傳入headers,形式為鍵值對
但是headers不能定義cookie)

#DEFAULT_REQUEST_HEADERS = {

#}
在請求中傳入headers
scrapy.Request(
self.start_urls[0],
callback=self.parse,
headers={xx:xx,xx:xx} # 這些引數會和預設請求頭的引數進行合併，然後請求時帶上合併後的請求頭
)

4.獲取請求頭和響應頭的引數（引數名不確定時可以開啟瀏覽器開發者工具檢視）

response.request.headers.getlist(引數名)

response.headers.getlist(引數名)

5.response響應物件
response.url：當前響應的url地址
response.request.url：當前響應對應的請求的url地址
response.headers：響應頭
response.body：響應體，也就是html程式碼，預設是byte型別
response.requests.headers：當前響應的請求頭

本作品採用《CC 協議》，轉載必須註明作者和本文連結

去除掉 Response Headers 中的 X-Powered-By
2021-01-14
Header
HTTP Headers的Request Headers
2020-12-16
HTTPHeader
node中的response.write()和response.end()
2019-04-12
Servlet中的response物件
2020-11-14
Servlet物件
scrapy中的selenium
2019-03-04
Scrapy框架中的Middleware擴充套件與Scrapy-Redis分散式爬蟲
2023-10-16
框架套件Redis分散式爬蟲
Scrapy框架的使用之Scrapy入門
2018-05-02
框架
scrapy在pychram中除錯
2024-08-01
除錯
HTML headers 屬性
2018-11-03
HTMLHeader
Response
2024-08-03
Scrapy框架的使用之Scrapy框架介紹
2018-05-02
框架
Scrapy框架的使用之Scrapy通用爬蟲
2018-05-21
框架爬蟲
Scrapy框架的使用之Scrapy對接Splash
2018-05-18
框架
在scrapy的pipelines中連線資料庫
2018-06-15
資料庫
解決介面呼叫的provisional headers are shown
2018-10-10
Header
django的response-8
2018-10-19
Django
SpringBoot中的response和request模擬單元測試
2018-07-30
Spring Boot
Nuxt.js 應用中的 render：response 事件鉤子
2024-11-29
UXJS事件
對Response中的響應體做統一處理
2021-09-01
關於 Angular HTTP Interceptor 中 Request 和 Response 的 immutable 特性
2022-10-15
AngularHTTP
provisional headers are shown 知多少
2018-11-30
Header
爬蟲headers引數
2020-10-25
爬蟲Header
http headers 大總結
2020-04-12
HTTPHeader
淺談Python中的scrapy的安裝和建立工程。
2018-08-01
Python
Response物件
2018-08-15
物件
Scrapy框架的使用之Scrapy爬取新浪微博
2018-05-23
框架
求助，怎麼修改 response 響應中的 Cookie 的屬性值
2020-01-06
Cookie
Java Web中的request,response,重定位與轉發的詳解
2024-08-18
JavaWeb
request和response的區別
2020-12-01
http http headers參考文件
2018-05-08
HTTPHeader
laravel的response()函式中，輸入array卻響應json的原因
2020-12-20
Laravel函式JSON
Response重定向
2024-08-03
Request&Response
2022-01-24
Python中scrapy下載儲存圖片
2021-08-09
Python
構建帶headers-more-nginx-module的nginx
2024-09-19
HeaderNginx
Python Scrapy 爬蟲（二）：scrapy 初試
2018-08-13
Python爬蟲
JAVA的request和response有效域
2021-09-09
Java
scrapy（2）
2024-05-22

scrapy 中的 headers，Resquest，response

相關文章