Scrapy 教程

weixin_34353714發表於2017-05-27

安裝scrapy
這裡提示一個技巧，我們用douban的源，這樣安裝快些

pip install -i https://pypi.douban.com/simple virtualenv

用scrapy新建一個工程

scrapy startproject yourProject

新建一個爬蟲

scrapy genspider 爬蟲名稱 example.com(爬蟲網址)

這裡我是用pycharm和virtualenv,開發的，我在pycharm設定下編譯環境，一般在你環境下的bin目錄下python2.7

image.png

image.png

由於pycharm沒法直接除錯scrapy，我們需要自己新建一個main.py來執行scrapy的命令列，新建的main.py程式碼如下

from scrapy.cmdline import execute

import sys
import os

sys.path.append(os.path.dirname(os.path.abspath(__file__))) #加入該模組
execute(["scrapy", "crawl", "jobbole"]) #相當於命令列 scrapy crawl jobbole(之前設定的爬蟲名稱)

這樣就可以用斷點進行除錯了

禁止robot協議，避免過濾了有爬蟲協議的網站，導致爬的網站很少，?
修改settings.py,將

ROBOTSTXT_OBEY = False

scrapy入門教程3：scrapy的shell命令
2016-06-02
scrapy入門教程1：scrapy環境配置以及安裝
2016-06-02
Python scrapy基礎教程（三）
2017-04-12
Python
Python scrapy基礎教程（二）
2017-04-11
Python
Python scrapy基礎教程（一）
2017-04-11
Python
scrapy和scrapy-redis有什麼區別?Python基礎教程
2021-08-18
RedisPython
scrapy入門教程()部署爬蟲專案
2018-09-27
爬蟲
Python爬蟲教程-33-scrapy shell 的使用
2018-09-06
Python爬蟲
爬蟲教程——用Scrapy爬取豆瓣TOP250
2018-10-31
爬蟲
scrapy爬蟲函式間傳值簡易教程
2017-05-09
爬蟲函式
Python爬蟲教程-30-Scrapy 爬蟲框架介紹
2018-09-06
Python爬蟲框架
Scrapy框架的使用之Scrapy入門
2018-05-02
框架
Scrapy框架
2023-03-29
框架
初始scrapy
2024-04-04
scrapy使用
2024-04-12
scrapy（2）
2024-05-22
Python Scrapy 爬蟲（二）：scrapy 初試
2018-08-13
Python爬蟲
scrapy之分散式爬蟲scrapy-redis
2020-12-24
分散式爬蟲Redis
Scrapy框架的使用之Scrapy通用爬蟲
2018-05-21
框架爬蟲
Scrapy框架的使用之Scrapy對接Splash
2018-05-18
框架
Scrapy框架的使用之Scrapy框架介紹
2018-05-02
框架
Python爬蟲教程-31-建立 Scrapy 爬蟲框架專案
2018-09-04
Python爬蟲框架
Scrapy框架的使用之Scrapy爬取新浪微博
2018-05-23
框架
Scrapy定向爬蟲教程(一)——建立執行專案和基本介紹
2016-10-13
爬蟲
scrapy入門
2018-12-13
scrapy爬蟲
2012-05-09
爬蟲
scrapy 基礎
2024-07-05
Scrapy-Redis
2024-07-05
Redis
scrapy新增新命令
2019-02-16
Scrapy框架-Spider
2019-02-15
框架IDE
Scrapy爬蟲-草稿
2018-09-08
爬蟲
Scrapy框架簡介
2019-01-06
框架
CentOS 安裝Scrapy
2017-03-29
CentOS
Scrapy 對接 Docker
2018-04-18
Docker
scrapy安裝——Ubuntu
2014-03-18
Ubuntu
ubuntu安裝Scrapy
2013-05-22
Ubuntu
Scrapy爬蟲框架
2024-11-13
爬蟲框架
Scrapy框架-通過scrapy_splash解析動態渲染的資料
2018-07-13
框架

Scrapy 教程

相關文章