python 基礎之scrapy 原理練習

donghongchao發表於2024-07-16

原文網址 : https://www.cnblogs.com/dhcc/p/18304902

1、Scrapy Engine（引擎元件）：
負責Spider、ItemPipeline、Downloader、Scheduler的工作排程、資訊通訊、資料傳遞等工作
2、Scheduler（排程元件）：
負責接收引擎傳遞過來的請求，按照具體規則新增佇列處理，最終返回給引擎
3、Downloader（下載元件）：
負責下載引擎傳遞過來的所有Request請求，最終伺服器的響應資料返回給引擎元件
4、Spider（爬蟲）：
處理所有Response響應，分析提取Item資料
如果資料中有二次請求，繼續交給引擎元件
5、ItemPipeline（管道）：
負責[分析、過濾、儲存]處理由Spiders獲取到的Item資料

1、引擎向spiders要url
2、引擎將要爬取的url給排程器
3、排程器會將url生成請求物件放入到指定的佇列中
4、從佇列中出隊一個請求
5、引擎將請求交給下載器進行處理
6、下載器傳送請求從網際網路上獲取資料
7、下載器將資料返回給引擎
8、引擎將資料再次給spiders
9、spiders透過xpath解析器解析資料，解析到資料或者url
10、spiders將資料或者url給引擎
11、引擎判斷是資料還是url，資料交給管道處理，url交給排程器處理
12、管道將資料持久化儲存

新版scrapy 簡單好用

import scrapy

class CarhomeSpider(scrapy.Spider):
    name = "carhome"
    allowed_domains = ["car.autohome.com.cn"]
    start_urls = ["https://car.autohome.com.cn/price/brand-15.html"]

    def parse(self, response):
        price_list = response.xpath("//div[@class='main-lever-right']//span[1]/text()")
        # for index in context:
        #     cat_price = context[index]
        #     print(cat_price)
        name_list = response.xpath("//div[@class='main-title']/a/text()")

        for i in range(len(name_list)):
            name = name_list[i]
            price = price_list[i]
            print(name,price)

Python爬蟲之Scrapy學習（基礎篇）
2019-03-04
Python爬蟲
Python基礎練習題
2020-12-25
Python
python基礎 while迴圈練習
2022-10-02
PythonWhile
9道python基礎練習題
2020-12-02
Python
python基礎語句小練習
2020-12-27
Python
Java學習之基礎語法練習
2020-12-30
Java
Python之物件導向基礎小練
2020-10-07
Python物件
python基礎（四）----列表、字典練習題
2024-04-01
Python
scrapy 基礎
2024-07-05
pandas學習之Python基礎
2020-12-16
Python
Python3 （基礎練習）猴子吃桃
2020-09-25
Python
基礎練習——python特殊的數字——2020.11.17
2020-11-17
Python
【21】Python100例基礎練習（5）
2021-09-09
Python
HTML基礎練習
2024-11-09
HTML
MySQL基礎練習
2021-06-13
MySql
scrapy和scrapy-redis有什麼區別?Python基礎教程
2021-08-18
RedisPython
python基礎學習之特徵工程
2019-08-28
Python特徵工程
Python基礎學習之迴圈
2021-09-09
Python
linux基礎練習題
2018-08-06
Linux
JAVA 基礎練習題
2020-01-28
Java
IOS基礎-Masonry 練習
2018-03-30
iOS
零基礎學習 Python 之字串
2018-12-12
Python字串
Java基礎 --- 綜合練習
2024-03-13
Java
零基礎學習 Python 之閉包
2019-03-04
Python
零基礎學習 Python 之函式
2019-01-06
Python函式
零基礎學習 Python 之檔案
2019-02-27
Python
python基礎之字串
2020-10-02
Python字串
Python3.x 基礎練習題100例（51-60）
2021-02-28
Python
python程式設計基礎：深度學習基礎：繪相簿之matplotlib(1)
2018-06-24
Python程式設計深度學習
基礎練習高精度加法(java)
2018-11-10
Java
Kafka原理分析之基礎篇
2021-05-04
Kafka
python基礎學習
2019-02-16
Python
Python 3 學習筆記之——基礎語法
2018-10-24
Python筆記
Scrapy基礎（二）：使用詳解
2018-12-12
Python教程系列（一）—— Python基礎教程之第一個程式設計練習
2019-01-07
Python程式設計
python：scrapy學習demo分享
2019-12-04
Python
Python程式設計基礎練習——撲克牌發牌問題
2020-11-11
Python程式設計
python 基礎之檔案
2018-12-15
Python

python 基礎之scrapy 原理練習

相關文章