Scrapy視覺化管理軟體SpiderKeeper

Gin.p發表於2017-10-18

通常開發好的Scrapy爬蟲部署到伺服器上，要不使用nohup命令，要不使用scrapyd。如果使用nohup命令的話，爬蟲掛掉了，你可能還不知道，你還得上伺服器上查或者做額外的郵件通知操作。如果使用scrapyd，就是部署爬蟲的時候有點複雜，功能少了點，其他還好。

SpiderKeeper是一款管理爬蟲的軟體，和scrapinghub的部署功能差不多，能多臺伺服器部署爬蟲，定時執行爬蟲，檢視爬蟲日誌，檢視爬蟲執行情況等功能。
專案地址：https://github.com/DormyMo/SpiderKeeper

一、執行環境

Centos7
Python2.7
Python3.6
注意：supervisor用的是Python2.7，scrapyd用的是Python3.6，需要自行編譯安裝。Python3具體安裝自行百度。

二、安裝依賴

1、supervisor pip install supervisor
2、scrapyd pip3 install scrapyd
3、SpiderKeeperpip3 install SpiderKeeper

三、配置scrapyd

1、新建scrapyd的配置檔案：

[scrapyd]
eggs_dir    = eggs
logs_dir    = logs
items_dir   =
jobs_to_keep = 5
dbs_dir     = dbs
max_proc    = 0
max_proc_per_cpu = 4
finished_to_keep = 100
poll_interval = 5.0
bind_address = 0.0.0.0
http_port   = 6800
debug       = off
runner      = scrapyd.runner
application = scrapyd.app.application
launcher    = scrapyd.launcher.Launcher
webroot     = scrapyd.website.Root

[services]
schedule.json     = scrapyd.webservice.Schedule
cancel.json       = scrapyd.webservice.Cancel
addversion.json   = scrapyd.webservice.AddVersion
listprojects.json = scrapyd.webservice.ListProjects
listversions.json = scrapyd.webservice.ListVersions
listspiders.json  = scrapyd.webservice.ListSpiders
delproject.json   = scrapyd.webservice.DeleteProject
delversion.json   = scrapyd.webservice.DeleteVersion
listjobs.json     = scrapyd.webservice.ListJobs
daemonstatus.json = scrapyd.webservice.DaemonStatus

四、配置supervisor

1、建立配置的資料夾和配置檔案

mkdir /etc/supervisor
echo_supervisord_conf > /etc/supervisor/supervisord.conf

2、編輯配置檔案vim /etc/supervisor/supervisord.conf

;[include]
;files = relative/directory/*.ini

改為

[include]
files = conf.d/*.conf

3、新建conf.d資料夾mkdir /etc/supervisor/conf.d
4、新增scrapyd的配置檔案vim /etc/supervisor/conf.d/scrapyd.conf

[program:scrapyd]
command=/usr/local/python3.5/bin/scrapyd
directory=/opt/SpiderKeeper
user=root
stderr_logfile=/var/log/scrapyd.err.log
stdout_logfile=/var/log/scrapyd.out.log

5、新增spiderkeeper的配置檔案vim /etc/supervisor/conf.d/spiderkeeper.conf

[program:spiderkeeper]
command=spiderkeeper --server=http://localhost:6800
directory=/opt/SpiderKeeper
user=root
stderr_logfile=/var/log/spiderkeeper.err.log
stdout_logfile=/var/log/spiderkeeper.out.log

6、啟動supervisor，supervisord -c /etc/supervisor/supervisord.conf

五、使用

1、登入http://localhost:5000
2、新建project
3、打包爬蟲檔案
pip3 install scrapyd-client
scrapyd-deploy --build-egg output.egg
4、上傳打包好的爬蟲egg檔案

SpiderKeeper可以識別多臺伺服器的scrapyd，具體多加--server就好。

視覺化資料分析軟體
2021-11-30
視覺化
三維視覺化設計軟體，可以實現資料視覺化的軟體有哪些
2023-02-24
視覺化
科學視覺化軟體系列文章
2024-07-13
視覺化
研發進度的視覺化專案管理軟體哪個好？
2022-06-07
視覺化專案管理
視覺化大屏用什麼軟體做，用什麼軟體製作視覺化大屏比較好
2023-02-14
視覺化
最火前端Web組態軟體(視覺化)
2022-06-23
前端Web視覺化
ISM Web工業視覺化組態軟體
2023-01-16
Web視覺化
資料視覺化效果怎麼做，資訊視覺化設計用什麼軟體
2023-02-13
視覺化
動態的視覺化大屏怎麼做，哪些可以做資料視覺化軟體
2023-02-16
視覺化
分析哪款專案管理軟體的資料視覺化功能比較完善？
2022-07-12
專案管理視覺化
資料視覺化軟體有什麼特點
2022-04-21
視覺化
BI軟體精選|3款低程式設計資料視覺化軟體
2023-02-27
程式設計視覺化
資料視覺化大屏怎麼開發，視覺化大屏用什麼軟體製作
2023-02-15
視覺化
視覺化資料用什麼軟體做，大資料視覺化是用什麼做的
2023-02-20
視覺化大資料
Elsten Software Bliss破解版(音樂視覺化管理軟體)
2023-11-09
視覺化
MySQL 視覺化管理工具
2022-12-30
MySql視覺化
API視覺化管理平臺YApi
2020-10-11
API視覺化
Scrapy爬取二手房資訊+視覺化資料分析
2019-03-04
視覺化
奧威BI軟體 | 職場人的資料視覺化救星
2023-11-06
視覺化
不用SQL做資料視覺化的BI軟體有哪些？
2023-04-19
SQL視覺化
大屏視覺化用什麼開發，視覺化地圖用什麼軟體做好一點
2023-02-22
視覺化地圖
YApi視覺化介面管理平臺部署
2024-07-16
API視覺化
做電商資料分析視覺化，這個國產BI軟體很香
2023-05-04
視覺化
效率與便捷兼備，大資料視覺化軟體操作指南
2021-11-10
大資料視覺化
工業領域Web組態視覺化開發工具軟體
2023-04-03
Web視覺化
視覺化
2020-08-04
視覺化
工業綠色發展視覺化管理——高爐鍊鐵廠視覺化系統
2021-05-26
視覺化
Git--視覺化管理工具-SourceTree
2020-12-10
Git視覺化
FxFactory 8 pro for Mac(視覺特效軟體包)
2022-10-31
Mac視覺特效
10個最佳的3D視覺化軟體平臺推薦
2022-07-29
3D視覺化
資料視覺化│用了這個軟體我終於不禿頭了
2022-03-18
視覺化
奧威BI資料視覺化軟體|讓業務獨立自主分析
2023-04-11
視覺化
對接金蝶ERP的bi資料視覺化軟體有哪些？
2023-02-15
視覺化
圖撲軟體 | 虛擬電廠負荷控制系統視覺化
2023-02-07
視覺化
BI軟體推薦|適用於零售業的BI資料視覺化軟體OurwayBI
2023-02-23
視覺化
疫情下軟體資訊科技營收增長遠端運維IT資料視覺化管理護航線上業務
2020-04-21
營收運維視覺化
3D視覺化|疫情態勢視覺化
2021-10-26
3D視覺化
數字化運營與視覺化管理的區別
2022-05-12
視覺化