python爬取換頁_爬蟲爬不進下一頁了,怎麼辦
該樓層疑似違規已被系統摺疊 隱藏此樓檢視此樓
#-*- coding: UTF-8 -*-
import scrapy
from hoho.items import HohoItem
import re
from scrapy.selector import Selector
import sys
reload(sys)
sys.setdefaultencoding( "UTF-8" )
class tongSpider(scrapy.Spider):
name = 'guwen'
start_urls=['http://www.shicifuns.com/v2/wenyan/list']
def parse(self,response):
papers = response.xpath('//div[@class="css_content"]/div/div[@class="css_body_left"]/div[@class="every_day"]/ul')
for paper in papers:
for p in paper.xpath('li'):
name = p.xpath('a/div/div[@class="poem_title"]/span/text()').extract()[0]
url = p.xpath('a/@href').extract()[0]
content = p.xpath('a/div/div[@class="poem_content"]/text()').extract()[0].strip("\r\n ")
author = p.xpath('a/div/div[@class="poem_info"]/span[@class="dynasty"]/text()').extract()[0]
pinfen = p.xpath('a/div/div[@class="poem_info"]/span[@class="dynasty"]/text()').extract()[1]
item = HohoItem(name = name,url="http://www.shicifuns.com"+url,content=content,author=author,pinfen=pinfen)
yield item
next = response.xpath("//div[@class='css_content']/div/div[@class='css_body_left']/div[@class='pagination']/ul/li/a[@class='next page focus']/@href").extract()
if next:
yield scrapy.Request(url = "http://www.shicifuns.com" + next[0],callback=self.parse)
相關文章
- python爬蟲怎麼翻頁Python爬蟲
- python爬蟲---網頁爬蟲,圖片爬蟲,文章爬蟲,Python爬蟲爬取新聞網站新聞Python爬蟲網頁網站
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- node:爬蟲爬取網頁圖片爬蟲網頁
- 爬蟲——網頁爬取方法和網頁解析方法爬蟲網頁
- 《網頁爬蟲》網頁爬蟲
- 網路爬蟲有什麼用?怎麼爬?手把手教你爬網頁(Python程式碼)爬蟲網頁Python
- python 爬蟲如何爬取動態生成的網頁內容Python爬蟲網頁
- Python爬蟲教程-13-爬蟲使用cookie爬取登入後的頁面(人人網)(下)Python爬蟲Cookie
- Python爬蟲教程-12-爬蟲使用cookie爬取登入後的頁面(人人網)(上)Python爬蟲Cookie
- python爬蟲爬取網頁中文亂碼問題的解決Python爬蟲網頁
- 一起學爬蟲——使用Beautiful Soup爬取網頁爬蟲網頁
- Node JS爬蟲:爬取瀑布流網頁高清圖JS爬蟲網頁
- Java爬蟲翻頁Java爬蟲
- Python 爬蟲進階篇-利用beautifulsoup庫爬取網頁文章內容實戰演示Python爬蟲網頁
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- 如何使用python進行網頁爬取?Python網頁
- python 爬蟲網頁登陸Python爬蟲網頁
- 提高爬蟲爬取效率的辦法爬蟲
- 爬蟲學習筆記:練習爬取多頁天涯帖子爬蟲筆記
- 什麼是爬蟲?學習Python爬蟲難不難?爬蟲Python
- golang解析網頁,可以做爬蟲了Golang網頁爬蟲
- python 爬蟲 爬取 learnku 精華文章Python爬蟲
- python爬蟲——爬取大學排名資訊Python爬蟲
- Python網路爬蟲之爬取淘寶網頁頁面 MOOC可以執行的程式碼Python爬蟲網頁
- [Python Scrapy爬蟲] 二.翻頁爬取農產品資訊並儲存本地Python爬蟲
- 手把手教你利用爬蟲爬網頁(Python程式碼)爬蟲網頁Python
- Python爬蟲之網頁圖片Python爬蟲網頁
- 爬取網頁文章網頁
- 關於python爬取網頁Python網頁
- Python網路爬蟲第三彈《爬取get請求的頁面資料》Python爬蟲
- python爬蟲--爬取鏈家租房資訊Python爬蟲
- Python爬蟲爬取美劇網站Python爬蟲網站
- python爬蟲爬取糗事百科Python爬蟲
- 什麼是爬蟲?Python爬蟲的工作流程怎樣?爬蟲Python
- 爬蟲進階:反反爬蟲技巧爬蟲
- 【python爬蟲】python爬蟲demoPython爬蟲
- Python爬蟲使用代理proxy抓取網頁Python爬蟲網頁