Scrapy有什麼功能?架構有哪些?
眾所周知,Python有很多框架可以使用,比如說Scrapy。它是一個適用於Python的一個快速、高層次的螢幕抓取和web抓取框架,用於抓取web站點並從網頁中提取結構化的資料,用途十分廣泛,那麼你知道Scrapy有什麼功能嗎?Scrapy的架構是什麼?
Scrapy是一個適用抓取網站資料、提取結構性資料的應用程式框架,它可以應用在廣泛的領域,Scrapy常應用在包括資料探勘、資訊處理和儲存歷史資料等一系列的程式中,通常我們可以很簡單的透過Scrapy框架實現一個爬蟲,抓取指定網站的內容或圖片。
Scrapy的架構有哪些?
Scrapy Engine:負責Spider、itemPipeline、Downloader、Scheduler中間的通訊,資訊、資料傳遞等;
Scheduler:負責接受引擎傳送過來的Request請求,並按照一定的方式進行整理排序,入隊,當引擎需要時,交還給引擎;
Downloader:負責下載Scrapy Engine傳送的所有Requests請求,並將其獲取到的Responses交還給Scrapy Engine,由引擎交給Spider來處理;
Spider:負責處理Responses,從中分析提取資料,獲取Item欄位需要的資料,並將需要跟進的URL提交給引擎,再次進入Scheduler;
Item Pipeline:負責處理Spider中獲取的item,並進行後期處理的地方;
Downloader Middlewares:一個可以自定義擴充套件下載功能的元件;
Spider Middlewares:一個可以自定擴充套件和操作引擎和Spider中間通訊的功能元件。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/69952527/viewspace-2760522/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- kubernetes是什麼?有哪些功能?
- IPIDEA代理IP是什麼,有哪些功能?Idea
- Linux有什麼特點?體系結構有哪些?Linux
- NFC是什麼功能?有哪些使用場景?
- scrapy和scrapy-redis有什麼區別?Python基礎教程RedisPython
- HDFS 01 - HDFS是什麼?它的適用場景有哪些?它的架構是什麼?架構
- Linux中master是什麼意思?有哪些重要的功能?LinuxAST
- 網路安全堡壘機是什麼?有哪些功能?
- 免費的CRM軟體有哪些?功能是什麼?
- axure是什麼軟體幹什麼的 axure怎麼用有哪些功能
- cdn加速有什麼功能?
- 什麼是Linux核心?有什麼功能?Linux
- 輕量級前端架構有哪些特性?前端架構
- 網路儲存伺服器是什麼有哪些功能伺服器
- WebSocket有什麼優勢?有哪些特點?Web
- 國密瀏覽器是什麼?有哪些?有什麼特點?瀏覽器
- 資料庫是什麼意思?有什麼用?有哪些型別?資料庫型別
- 資料架構的基本原則有哪些?架構
- 【知識分享】什麼是檔案伺服器有哪些功能伺服器
- 什麼是DDI?DDI有哪些功能特點?(中科三方)
- cat命令有哪些功能用途?學習linux主要學什麼Linux
- Python的容器有哪些?分別有什麼作用?Python
- 什麼是無伺服器架構?有何優勢?伺服器架構
- 雲組態和傳統組態有什麼不同?有什麼功能?
- SFTP是什麼協議?優勢有哪些?與FTP有什麼不同?FTP協議
- CRM的功能模組有什麼?
- wms庫房辦理體系是什麼,有哪些功能模組
- Python是什麼?Python有哪些框架?Python框架
- 什麼是Docker?Docke有哪些特性?Docker
- Linux是什麼?Linux有哪些版本?Linux
- 什麼是HTTPDNS?HTTPDNS有哪些作用?httpdDNS
- CRM是什麼意思,有哪些作用?
- Linux yum命令有什麼作用?有哪些常用引數?Linux
- python中print()有什麼用?常用引數有哪些?Python
- Docker有哪些特點?與Linux有什麼區別?DockerLinux
- Pycharm有什麼優勢?常見快捷鍵有哪些?PyCharm
- iOS證書是由什麼構成的有哪些型別iOS型別
- 什麼是組態雲平臺?有什麼功能?