python 爬取飄花電影 下載地址
import requests
from lxml import etree
from lxml import html
#from lxml.html import fromstring, tostring
url = “https://www.piaohua.com/html/kehuan/”
class Spider(object):
def start_requests(self):
response = requests.get(url)
#response = requests.get(url,headers = headers)
#print(response.encoding)
response.encoding = ‘utf-8’
#print(response.text)
xml = etree.HTML(response.text)
film_tit_list = xml.xpath('//li[@class="col-md-6"]/div[@class="txt"]/h3/a/b/font/text()')
film_src_list = xml.xpath('//li[@class="col-md-6"]/div[@class="txt"]/h3/a/@href')
#print(film_tit_list,film_src_list)
for tit_list,src_list in zip(film_tit_list,film_src_list):
final_src_list = "https://www.piaohua.com" + src_list
#print(tit_list,src_list)
print(tit_list,final_src_list)
self.next_file(tit_list,src_list)
def next_file(self,tit_list,src_list):
response = requests.get("https://www.piaohua.com" + src_list)
response.encoding = 'utf-8'
xml = etree.HTML(response.text)
magnet = xml.xpath('//div[@class="bot"]/a/text()')
content = xml.xpath('//div[@class="article"]/p/text()')
#content = "\n".join(xml.xpath('//div[@class="article"]/p/text()'))
#print(last_tile) ,encoding="utf-8"
for last_tit_list,last_src_list,last_url in zip(tit_list,src_list,magnet):
print(last_tit_list,last_url,last_src_list)
spider = Spider()
spider.start_requests()
相關文章
- Python爬取電影天堂Python
- Python爬蟲批次下載電影連結Python爬蟲
- python爬取貓眼正在熱映電影Python
- Python爬取分析豆瓣電影Top250Python
- 使用python爬取豆瓣電影TOP250Python
- python更換代理爬取豆瓣電影資料Python
- Python3爬取貓眼電影資訊Python
- Python爬蟲筆記(4):利用scrapy爬取豆瓣電影250Python爬蟲筆記
- Python爬蟲教程-17-ajax爬取例項(豆瓣電影)Python爬蟲
- python爬蟲 爬取豆瓣電影 1-10 ajax 資料Python爬蟲
- Python爬蟲例項:爬取貓眼電影——破解字型反爬Python爬蟲
- Python爬蟲——批次爬取douyin影片,下載到本地Python爬蟲
- 擼個爬蟲,爬取電影種子爬蟲
- python爬取貓眼電影top100儲存到CSVPython
- scrapy爬取豆瓣電影資料
- Python爬蟲教程-11-proxy代理IP,隱藏地址(貓眼電影)Python爬蟲
- 【python爬蟲案例】利用python爬取豆瓣電影TOP250評分排行資料!Python爬蟲
- Python網路爬蟲實踐案例:爬取貓眼電影Top100Python爬蟲
- python 國內下載地址Python
- Python網路爬蟲(正則, 內涵段子,貓眼電影, 鏈家爬取)Python爬蟲
- python-爬蟲-css提取-寫入csv-爬取貓眼電影榜單Python爬蟲CSS
- 爬蟲如何爬取貓眼電影TOP榜資料爬蟲
- 爬蟲01:爬取豆瓣電影TOP 250基本資訊爬蟲
- 1.HtmlAgilityPack爬取優酷電影名HTML
- python爬取鬥圖啦表情包並下載到本地Python
- Python反爬:利用js逆向和woff檔案爬取貓眼電影評分資訊PythonJS
- 同花順資料爬取
- scrapy入門:豆瓣電影top250爬取
- python初級爬蟲之貓眼電影Python爬蟲
- Python電影爬蟲之身體每況愈下Python爬蟲
- python爬蟲學習01--電子書爬取Python爬蟲
- 爬取豆瓣電影Top250和資料分析
- 利用Python爬取攝影網站圖片,切勿商用Python網站
- 教你用python登陸豆瓣並爬取影評Python
- Python學習:爬個電影資源網站Python網站
- 爬蟲 Scrapy框架 爬取圖蟲圖片並下載爬蟲框架
- Python爬取豆瓣電影的短評資料並進行詞雲分析處理Python
- 正規表示式_爬取豆瓣電影排行Top250