python 爬取飄花電影 下載地址
import requests
from lxml import etree
from lxml import html
#from lxml.html import fromstring, tostring
url = “https://www.piaohua.com/html/kehuan/”
class Spider(object):
def start_requests(self):
response = requests.get(url)
#response = requests.get(url,headers = headers)
#print(response.encoding)
response.encoding = ‘utf-8’
#print(response.text)
xml = etree.HTML(response.text)
film_tit_list = xml.xpath('//li[@class="col-md-6"]/div[@class="txt"]/h3/a/b/font/text()')
film_src_list = xml.xpath('//li[@class="col-md-6"]/div[@class="txt"]/h3/a/@href')
#print(film_tit_list,film_src_list)
for tit_list,src_list in zip(film_tit_list,film_src_list):
final_src_list = "https://www.piaohua.com" + src_list
#print(tit_list,src_list)
print(tit_list,final_src_list)
self.next_file(tit_list,src_list)
def next_file(self,tit_list,src_list):
response = requests.get("https://www.piaohua.com" + src_list)
response.encoding = 'utf-8'
xml = etree.HTML(response.text)
magnet = xml.xpath('//div[@class="bot"]/a/text()')
content = xml.xpath('//div[@class="article"]/p/text()')
#content = "\n".join(xml.xpath('//div[@class="article"]/p/text()'))
#print(last_tile) ,encoding="utf-8"
for last_tit_list,last_src_list,last_url in zip(tit_list,src_list,magnet):
print(last_tit_list,last_url,last_src_list)
spider = Spider()
spider.start_requests()
相關文章
- Python爬取電影天堂Python
- Python爬蟲批次下載電影連結Python爬蟲
- python爬取貓眼正在熱映電影Python
- 使用python爬取豆瓣電影TOP250Python
- Python爬取分析豆瓣電影Top250Python
- Python3爬取貓眼電影資訊Python
- python更換代理爬取豆瓣電影資料Python
- Python爬蟲筆記(4):利用scrapy爬取豆瓣電影250Python爬蟲筆記
- Python爬蟲教程-17-ajax爬取例項(豆瓣電影)Python爬蟲
- python爬蟲 爬取豆瓣電影 1-10 ajax 資料Python爬蟲
- Python爬蟲例項:爬取貓眼電影——破解字型反爬Python爬蟲
- 擼個爬蟲,爬取電影種子爬蟲
- Python爬蟲入門 | 7 分類爬取豆瓣電影,解決動態載入問題Python爬蟲
- scrapy爬取豆瓣電影資料
- 1.HtmlAgilityPack爬取優酷電影名HTML
- 爬蟲01:爬取豆瓣電影TOP 250基本資訊爬蟲
- Python爬蟲教程-11-proxy代理IP,隱藏地址(貓眼電影)Python爬蟲
- 【python爬蟲案例】利用python爬取豆瓣電影TOP250評分排行資料!Python爬蟲
- python爬取貓眼電影top100儲存到CSVPython
- 爬蟲如何爬取貓眼電影TOP榜資料爬蟲
- Python網路爬蟲(正則, 內涵段子,貓眼電影, 鏈家爬取)Python爬蟲
- python-爬蟲-css提取-寫入csv-爬取貓眼電影榜單Python爬蟲CSS
- [python爬蟲] BeautifulSoup和Selenium對比爬取豆瓣Top250電影資訊Python爬蟲
- Python反爬:利用js逆向和woff檔案爬取貓眼電影評分資訊PythonJS
- 同花順資料爬取
- scrapy入門:豆瓣電影top250爬取
- 手把手教你爬取優酷電影資訊-2
- 手把手教你爬取優酷電影資訊 -1
- python 國內下載地址Python
- python爬取鬥圖啦表情包並下載到本地Python
- [Python學習] 簡單爬取CSDN下載資源資訊Python
- 爬取豆瓣電影Top250和資料分析
- 全棧 - 9 實戰 爬取豆瓣電影資料全棧
- Python電影爬蟲之身體每況愈下Python爬蟲
- python初級爬蟲之貓眼電影Python爬蟲
- Python 爬蟲——爬取小說 | 探索白子畫和花千骨的愛恨情仇Python爬蟲
- 爬取網站前3_下載限速網站
- python爬蟲學習01--電子書爬取Python爬蟲