一個完整的scrapy 專案

18923489164發表於2020-05-02

原文網址 : https://blog.csdn.net/AnYeZhiYin/article/details/105889203

#注意管道檔案一定要看settings.py是否開啟不然不會執行

# -*- coding: utf-8 -*-
import scrapy
from bs4 import BeautifulSoup as bs
import re
from douban.items import DoubanItem #這裡是要引入items欄位 

#scrapy crawl dou

class DouSpider(scrapy.Spider):

    name = 'dou' #爬蟲名字
    
    start_urls = ['https://movie.douban.com/subject/30314127/reviews'] #需要爬的連結

    def parse(self, response):
         
        html = response.text

        html = bs(html,'lxml')

        cont = html.findAll('div',class_='main review-item')

        for i in cont:

            item = DoubanItem()#這裡就是用items 欄位來存獲取的東西 相當於一個字典
                
            name = i.header.text
            name = re.sub('\n','',name)
                
            con = i.div.text
            con = re.sub('\n','',con)
            con = re.sub(' ','',con)


            item['name'] = name
            item['con'] = con


            #self.log(name)
            #self.log(con)
            #self.log('\n')
            #self.log('\n')
            
            yield item #存好就可以yield 這個是時時返回並不結束程式

import scrapy   #這個就是定義items 欄位了
class DoubanItem(scrapy.Item):

    name = scrapy.Field()

    con = scrapy.Field()

#管道檔案存items 欄位過來的內容

class DoubanPipeline(object):

    def process_item(self, item, spider):
        
        with open("douban.txt", "a",encoding='utf-8')as f:

            f.write(item['name'])
            f.write('\n')
            f.write(item['con'])

            f.write('\n')
            f.write('\n')
            f.write('\n')

        
        return item

Scrapy入門-第一個爬蟲專案
2018-07-23
爬蟲
一個專案完整的管理流程有哪些
2023-03-16
開源一個功能完整的SpringBoot專案框架
2020-01-11
Spring Boot框架
精通Scrapy網路爬蟲【一】第一個爬蟲專案
2021-06-19
爬蟲
scrapy 框架新建一個爬蟲專案詳細步驟
2018-06-09
框架爬蟲
分享一個完整的社群專案(Android端加後臺)
2019-03-04
Android
使用Express MongoDB開發一個完整MVC專案
2021-09-09
ExpressMongoDBMVC
如何5分鐘跑起來一個完整專案？
2023-02-24
webpack實戰（一）：真實專案中一個完整的webpack配置
2019-03-04
Web
完整的python專案例項-python完整專案
2020-10-28
Python
記一次完整的專案部署
2018-06-11
一個完整的機器學習專案在Python中的演練（一）
2018-10-11
機器學習Python
Python爬蟲深造篇(四)——Scrapy爬蟲框架啟動一個真正的專案
2021-11-08
Python爬蟲框架
一個完整的機器學習專案在Python中演練（四）
2018-10-11
機器學習Python
一個完整的機器學習專案在Python中演練（三）
2018-06-04
機器學習Python
scrapy實戰專案（簡單的爬取知乎專案）
2018-05-17
python實戰一個完整的專案-年終課程盤點｜16 個 Python 綜合實戰專案合集
2022-01-23
Python
帶你從0搭建一個Springboot+elasticsearch+canal的完整專案 - dailyhub
2022-01-26
Spring BootElasticsearchAI
一個工程實踐專案的完整軟體系統設計方案
2020-12-20
一個完整的機器學習專案在Python中的演練（三）
2018-10-11
機器學習Python
一個完整的機器學習專案在Python中的演練（二）
2018-10-11
機器學習Python
如果你也想寫個完整的 Vue 元件專案
2018-07-04
Vue元件
【asp.net core 系列】6 實戰之一個專案的完整結構
2020-06-06
ASP.NET
Sealos Devbox 基礎教程：使用 Cursor 從零開發一個完整的專案
2024-12-06
dev
關於一個java專案呼叫另一個java專案的心得
2019-03-28
Java
我的第一個 scrapy 爬蟲
2019-02-16
爬蟲
scrapy入門教程()部署爬蟲專案
2018-09-27
爬蟲
利用scrapy建立初始Python爬蟲專案
2018-03-04
Python爬蟲
搭建一個專案
2024-08-16
scrapy通用專案和爬蟲程式碼模板
2021-03-22
爬蟲
機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)
2019-01-26
機器學習
我的第一個Laravel專案
2019-05-11
Laravel
github上一個好玩的專案
2021-07-15
Github
一個小而全的Python專案示例
2021-04-24
Python
scrapy 單檔案啟動單個spider
2024-06-19
IDE
搭建一個SSM專案
2019-01-19
SSM
第一個SpringBoot專案
2020-08-24
Spring Boot
開始一個專案
2020-10-30

一個完整的scrapy 專案

相關文章