Python scrapy基礎教程(三)
歡迎加入學習交流QQ群:657341423
爬蟲最基本的就是對網頁的post和get,也就是http的post和get,這樣就可以動態實現自己想要那個網頁的資料。
scrapy的post和get使用是有一定限制的:
1.如果start_urls不是post介面,可以通過start_urls裡面找到介面路徑,然後在FormRequest
2.如果start_urls是post介面,只能重定義start_requests方法,定義為post方式。
3.如果get帶引數,直接在url引數化即可。
Get帶引數
其中,Spider和CrawlSpider都適用
這個比較簡單
start_urls帶引數也是可以的
如果start_urls是post介面
因為start_requests開始定義是get方法,如果介面是post的,會返回405錯誤碼,所以要重寫start_requests
如果start_urls不是post介面
start_urls為一個接收任務介面,為get,程式必需執行獲取到這個start_urls的內容後,在parse方法才執行post。
注意:start_urls的連結和parse裡面的turl必需有關聯才行,如果我把start_urls改為[‘https://www.baidu.com/’],parse是post不到的。
就是說,scrapy執行必需執行一次start_requests的方法才執行到自己寫的方法裡去。
scrapy與requests庫的post和get對比:
scrapy的post和get在寫法上比requests庫的要複雜一點。
scrapy必需按照流程一步一步走,雖然可以變動,但大體都是框架式的程式碼,靈活性低。基本流程:start_urls->start_requests->parse(Spider模式下,CrawlSpider差不了多小)
scrapy分散式爬蟲,工作分工明確,而且框架結構,便於維護和管理,利於大型的爬蟲
相關文章
- scrapy和scrapy-redis有什麼區別?Python基礎教程RedisPython
- python 基礎之scrapy 原理練習Python
- scrapy 基礎
- Python基礎教程Python
- Python爬蟲之Scrapy學習(基礎篇)Python爬蟲
- Python基礎教程.18214570Python
- Python Numpy基礎教程Python
- python基礎教程|菜鳥教程Python
- Python基礎面試題30問!Python基礎教程Python面試題
- 【莫煩】python基礎教程Python
- python-基礎教程-pprintPython
- Python (三) 基礎資訊Python
- python 基礎語法(三)Python
- Python基礎(三)數字Python
- python基礎(三)——操作列表Python
- Gurobi基礎教程(Python版)-系列教程2Python
- Scrapy基礎(二): 使用詳解
- (Python基礎教程之七)Python字串操作Python字串
- SpringCloud基礎教程(三)-Eureka進階SpringGCCloud
- Python全棧開發-Python基礎教程-01Python全棧
- Python基礎教程該如何學習?Python
- 2020年Python基礎教程,Python快速入門教程(非常詳細)Python
- python乾貨三例(需基礎) Python
- Python中常用模組有哪些?Python基礎教程Python
- Python教程分享之Python基礎知識點梳理Python
- scrapy框架簡介和基礎應用框架
- 一、Python複習教程(重點)- 基礎Python
- python極簡教程01:基礎變數Python變數
- Python培訓基礎教程都教哪些Python
- python爬蟲系列(三)scrapy基本概念Python爬蟲
- Python爬蟲教程-33-scrapy shell 的使用Python爬蟲
- 零基礎入門Python教程4節與基礎語法Python
- Python字元編碼的常用種類!Python基礎教程Python字元
- (Python基礎教程之十二)Python讀寫CSV檔案Python
- Python培訓教程之Python基礎知識點梳理Python
- Python入門基礎–三級選單Python
- Python基礎篇-Python基礎01Python
- WebGL基礎教程:第三部分Web
- 學Python程式設計有什麼用?Python基礎教程!Python程式設計