Python scrapy基礎教程(三)
歡迎加入學習交流QQ群:657341423
爬蟲最基本的就是對網頁的post和get,也就是http的post和get,這樣就可以動態實現自己想要那個網頁的資料。
scrapy的post和get使用是有一定限制的:
1.如果start_urls不是post介面,可以通過start_urls裡面找到介面路徑,然後在FormRequest
2.如果start_urls是post介面,只能重定義start_requests方法,定義為post方式。
3.如果get帶引數,直接在url引數化即可。
Get帶引數
其中,Spider和CrawlSpider都適用
這個比較簡單
start_urls帶引數也是可以的
如果start_urls是post介面
因為start_requests開始定義是get方法,如果介面是post的,會返回405錯誤碼,所以要重寫start_requests
如果start_urls不是post介面
start_urls為一個接收任務介面,為get,程式必需執行獲取到這個start_urls的內容後,在parse方法才執行post。
注意:start_urls的連結和parse裡面的turl必需有關聯才行,如果我把start_urls改為[‘https://www.baidu.com/’],parse是post不到的。
就是說,scrapy執行必需執行一次start_requests的方法才執行到自己寫的方法裡去。
scrapy與requests庫的post和get對比:
scrapy的post和get在寫法上比requests庫的要複雜一點。
scrapy必需按照流程一步一步走,雖然可以變動,但大體都是框架式的程式碼,靈活性低。基本流程:start_urls->start_requests->parse(Spider模式下,CrawlSpider差不了多小)
scrapy分散式爬蟲,工作分工明確,而且框架結構,便於維護和管理,利於大型的爬蟲
相關文章
- Python scrapy基礎教程(二)Python
- Python scrapy基礎教程(一)Python
- scrapy和scrapy-redis有什麼區別?Python基礎教程RedisPython
- Python Django基礎教程(三)(模型models)PythonDjango模型
- Python基礎教程Python
- Python爬蟲之Scrapy學習(基礎篇)Python爬蟲
- python 教程_【python 基礎教程詳解】Python
- python基礎教程|菜鳥教程Python
- Python Numpy基礎教程Python
- Python基礎面試題30問!Python基礎教程Python面試題
- Python (三) 基礎資訊Python
- python-基礎教程-pprintPython
- 【莫煩】python基礎教程Python
- Python 基礎知識教程Python
- Scrapy基礎(二): 使用詳解
- python 基礎語法(三)Python
- Python基礎(三)數字Python
- python基礎(三)——操作列表Python
- Gurobi基礎教程(Python版)-系列教程2Python
- Python Flask基礎教程(入門)PythonFlask
- Python基礎教程01 Hello World!Python
- Python基礎教程03 - 序列 (sequence)Python
- Python基礎教程06 - 迴圈Python
- Python基礎教程07 - 函式Python函式
- Python基礎教程04 運算Python
- 《Python基礎教程》小小有感Python
- Scrapy 教程
- SpringCloud基礎教程(三)-Eureka進階SpringGCCloud
- Python基礎之(三)之字典Python
- Python 快速教程(基礎篇02):基礎資料型別Python資料型別
- (Python基礎教程之七)Python字串操作Python字串
- Python基礎教程該如何學習?Python
- 1、python機器學習基礎教程——簡述Python機器學習
- Python 3基礎教程16-類Python
- Python Django基礎教程(五)(表單)PythonDjango
- Python Django基礎教程(一)(入門)PythonDjango
- Python基礎教程視訊集錦Python
- python基礎教程視訊下載Python