Python scrapy基礎教程（二）

HuangZhang_123發表於2017-04-11

原文網址 : https://blog.csdn.net/huangzhang_123/article/details/70053846

歡迎加入學習交流QQ群：657341423

爬取一般網站常用的spider。其定義了一些規則(rule)來提供跟進link的方便的機制。也許該spider並不是完全適合您的特定網站或專案。因此您可以以其為起點，根據需求修改部分方法。當然您也可以實現自己的spider。
也就是說spider是根據spider裡面的start_urls的url進行爬蟲的。但有時候我們爬取的url是帶有引數，或者需要登入了網站才能爬取資料的時候，這時候spider雖然能做到，但顯得有點乏力。
spider做法：直接看官方文件
這裡寫圖片描述

for url in response.xpath('//a/@href').extract():
    yield scrapy.Request(url, callback=self.parse)

實現方法就是通過start_urls獲取全部連結，然後用迴圈實現，但是遇到不同的連結，網頁內容肯定不一樣的，這時候就要做很多的判斷。這樣程式碼顯得臃腫。

CrawlSpider可以根據個人要求做到這個需求，說的白點就是，CrawlSpider就是靈活性高，可以任性一點。但CrawlSpider不會爬取start_urls這個連結的內容，只會根據rules篩選start_urls裡面的url，然後爬取這些url的內容

用法：根據上一教程，這裡只需修改spiders資料夾下的py檔案，這裡我新增一個py檔案，用於區別上一教程的
這裡寫圖片描述

其他檔案無需修改。
程式碼
這裡寫圖片描述
A：匯入包
B：設定rules內容，allow是設定start_urls這個網頁裡面符合條件的連結，deny是排除start_urls這個網頁含有條件的連結
C：callback就是指定的方法。
這段程式碼就是查詢start_urls這個網頁帶有shop而且不含有fr這個連結。

執行結果：
這裡寫圖片描述

程式碼下載
擴充套件：Scrapy模擬登入

scrapy和scrapy-redis有什麼區別?Python基礎教程
2021-08-18
RedisPython
Scrapy基礎（二）：使用詳解
2018-12-12
python 基礎之scrapy 原理練習
2024-07-16
Python
scrapy 基礎
2024-07-05
Python基礎教程
2020-12-26
Python
Python Scrapy 爬蟲（二）：scrapy 初試
2018-08-13
Python爬蟲
Python爬蟲之Scrapy學習（基礎篇）
2019-03-04
Python爬蟲
《Python基礎教程第二版》第二章-Python列表和元祖
2019-02-16
Python
Python基礎教程.18214570
2024-05-26
Python
Python Numpy基礎教程
2019-06-16
Python
python基礎教程|菜鳥教程
2020-11-03
Python
python程式設計基礎教程第二季
2020-04-04
Python程式設計
Python基礎面試題30問!Python基礎教程
2021-08-12
Python面試題
【莫煩】python基礎教程
2018-10-28
Python
python-基礎教程-pprint
2018-12-09
Python
Python基礎語法（二）
2018-12-05
Python
Gurobi基礎教程（Python版）-系列教程2
2020-09-26
Python
（Python基礎教程之七）Python字串操作
2021-09-09
Python字串
Python基礎知識之二
2018-09-18
Python
Python全棧開發-Python基礎教程-01
2020-12-07
Python全棧
Python基礎教程該如何學習?
2020-01-14
Python
Python基礎入門筆記（二）
2019-03-01
Python筆記
Python基礎知識入門（二）
2020-02-14
Python
二、python安裝和基礎使用
2020-09-25
Python
Python入門基礎知識（二）
2020-10-14
Python
python基礎(二)—-資料型別
2018-04-21
Python資料型別
第二課 Python基礎語法
2020-12-20
Python
2020年Python基礎教程，Python快速入門教程（非常詳細）
2020-09-29
Python
Python中常用模組有哪些?Python基礎教程
2021-09-13
Python
Python教程分享之Python基礎知識點梳理
2021-05-07
Python
Python3爬蟲（十八） Scrapy框架（二）
2018-10-26
Python爬蟲框架
scrapy框架簡介和基礎應用
2019-03-01
框架
一、Python複習教程（重點）- 基礎
2020-10-26
Python
python極簡教程01：基礎變數
2021-12-31
Python變數
Python培訓基礎教程都教哪些
2021-09-27
Python
Python爬蟲教程-33-scrapy shell 的使用
2018-09-06
Python爬蟲
零基礎入門Python教程4節與基礎語法
2021-03-24
Python
Python字元編碼的常用種類！Python基礎教程
2021-09-10
Python字元
（Python基礎教程之十二）Python讀寫CSV檔案
2021-09-09
Python

Python scrapy基礎教程（二）

相關文章