一個完整的scrapy 專案
#注意 管道檔案一定要看settings.py是否開啟不然不會執行
# -*- coding: utf-8 -*-
import scrapy
from bs4 import BeautifulSoup as bs
import re
from douban.items import DoubanItem #這裡是要引入items欄位
#scrapy crawl dou
class DouSpider(scrapy.Spider):
name = 'dou' #爬蟲名字
start_urls = ['https://movie.douban.com/subject/30314127/reviews'] #需要爬的連結
def parse(self, response):
html = response.text
html = bs(html,'lxml')
cont = html.findAll('div',class_='main review-item')
for i in cont:
item = DoubanItem()#這裡就是用items 欄位來存獲取的東西 相當於一個字典
name = i.header.text
name = re.sub('\n','',name)
con = i.div.text
con = re.sub('\n','',con)
con = re.sub(' ','',con)
item['name'] = name
item['con'] = con
#self.log(name)
#self.log(con)
#self.log('\n')
#self.log('\n')
yield item #存好就可以yield 這個是時時返回並不結束程式
import scrapy #這個就是定義items 欄位了
class DoubanItem(scrapy.Item):
name = scrapy.Field()
con = scrapy.Field()
#管道檔案存items 欄位過來的內容
class DoubanPipeline(object):
def process_item(self, item, spider):
with open("douban.txt", "a",encoding='utf-8')as f:
f.write(item['name'])
f.write('\n')
f.write(item['con'])
f.write('\n')
f.write('\n')
f.write('\n')
return item
相關文章
- Scrapy入門-第一個爬蟲專案爬蟲
- 一個專案完整的管理流程有哪些
- 完整的設計一個專案需要什麼?
- Scrapy的專案管道
- 精通Scrapy網路爬蟲【一】第一個爬蟲專案爬蟲
- scrapy 框架新建一個 爬蟲專案詳細步驟框架爬蟲
- 一個完整的機器學習專案在Python中的演練(一)機器學習Python
- 使用Express MongoDB開發一個完整MVC專案ExpressMongoDBMVC
- 如何5分鐘跑起來一個完整專案?
- 開源一個功能完整的SpringBoot專案框架Spring Boot框架
- 一個完整的機器學習專案在Python中演練(四)機器學習Python
- 一個完整的機器學習專案在Python中演練(三)機器學習Python
- webpack實戰(一):真實專案中一個完整的webpack配置Web
- 分享一個完整的社群專案(Android端加後臺)Android
- 記一次完整的專案部署
- 一個完整的機器學習專案在Python中的演練(三)機器學習Python
- 一個完整的機器學習專案在Python中的演練(二)機器學習Python
- 分享 50 個完整的 React Native 專案React Native
- 機器學習入門系列(2)--如何構建一個完整的機器學習專案(一)機器學習
- Scrapy建立爬蟲專案爬蟲
- 完整的python專案例項-python完整專案Python
- scrapy實戰專案(簡單的爬取知乎專案)
- 一個工程實踐專案的完整軟體系統設計方案
- python實戰一個完整的專案-年終課程盤點|16 個 Python 綜合實戰專案合集Python
- Python爬蟲深造篇(四)——Scrapy爬蟲框架啟動一個真正的專案Python爬蟲框架
- 如果你也想寫個完整的 Vue 元件專案Vue元件
- 【asp.net core 系列】6 實戰之 一個專案的完整結構ASP.NET
- PyCharm下進行Scrapy專案的除錯PyCharm除錯
- 如何用 PyCharm 除錯 scrapy 專案PyCharm除錯
- 我的第一個 scrapy 爬蟲爬蟲
- 帶你從0搭建一個Springboot+elasticsearch+canal的完整專案 - dailyhubSpring BootElasticsearchAI
- 關於一個java專案呼叫另一個java專案的心得Java
- 泰坦尼克生還預測:完整的機器學習專案(一)機器學習
- scrapy入門教程()部署爬蟲專案爬蟲
- 一個失敗專案的專案筆記(轉)筆記
- 搭建一個專案
- Scrapy定向爬蟲教程(一)——建立執行專案和基本介紹爬蟲
- scrapy通用專案和爬蟲程式碼模板爬蟲