騰牛網抓取（單頁）

随风小屋發表於2024-08-07

原文網址 : https://www.cnblogs.com/suifeng2000/p/18346224

騰牛網抓取（單頁）

建立時間：2024-08-05

一、完整程式碼

import requests
from lxml import etree
url = 'https://www.qqtn.com/wm/meinvtp_1.html'
header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'
}
res = requests.get(url, headers=header)
# data = res.content.decode('gbk') # 手動設定
res.encoding = res.apparent_encoding  # 自動獲取解碼格式
data = res.text
tree = etree.HTML(data)
url_list = tree.xpath('//ul[@class="g-gxlist-imgbox"]//img/@src')
url_title = tree.xpath('//ul[@class="g-gxlist-imgbox"]//a/@title')
for url, title in zip(url_list, url_title):
    print(f'下載{title}中-------')
    with open(f'./tnw/{title}.png', 'wb') as f:
        f.write(requests.get(url).content)

1.1 效果

二、知識點

2.1 xpath解析中間節點省略

2.2 使用zip遍歷

 zip(*iterables, strict=False)   
 
 
 zip物件產生長度為n的元組，其中n是作為位置引數傳遞給zip()的可迭代物件的數量。每個元組中的第i個元素來自zip()的第i個可迭代引數。這種情況一直持續到最短的論證被用盡為止。如果strict為真，並且其中一個引數先於其他引數用盡，則引發ValueError.

表情黨抓取（單頁） (網站已轉移)
2024-08-07
網站
NodeJS使用PhantomJs抓取網頁
2019-02-16
NodeJS網頁
如何抓取網頁資訊？
2022-06-02
網頁
網頁資料抓取之噹噹網
2020-12-21
網頁
批量抓取網頁pdf檔案
2019-02-16
網頁
使用chromedriver抓取網頁截圖
2024-11-07
Chrome網頁
使用代理抓取網頁的原因
2021-09-11
網頁
爬蟲抓取網頁資料原理
2021-12-06
爬蟲網頁
Python實現簡單網頁圖片抓取完整程式碼例項
2020-05-27
Python網頁
爬蟲抓取網頁的詳細流程
2023-11-28
爬蟲網頁
使用 Beautiful Soup 在 Python 中抓取網頁
2021-12-27
Python網頁
網頁抓取的重要性介紹
2021-12-16
網頁
IP地址在網頁抓取中的作用
2022-06-20
網頁
網頁抓取如何幫助資料分析？
2022-02-11
網頁
IP地址在網頁抓取中有何作用
2022-05-09
網頁
C#簡單的web網頁html抓取並提取指定a標籤連結
2019-05-11
C#Web網頁HTML
例項：使用puppeteer headless方式抓取JS網頁
2018-05-08
JS網頁
如何用Python爬資料？（一）網頁抓取
2018-06-27
Python網頁
學會XPath，輕鬆抓取網頁資料
2023-11-30
網頁
網頁抓取與IPIDEA代理IP的關係
2023-05-04
網頁Idea
網頁抓取常見的問題有哪些？
2023-01-11
網頁
網頁抓取五種常用的HTTP標頭
2022-06-28
網頁HTTP
抓取網頁的含義和URL基本構成
2023-10-24
網頁
基於Chrome的Easy Scraper外掛抓取網頁
2024-04-06
Chrome網頁
如何避免在網頁抓取時被檢測到？
2022-01-25
網頁
簡單網頁
2020-10-02
網頁
網頁抓取選擇代理應該考慮什麼？
2022-06-17
網頁
為什麼需要用代理進行網頁抓取？
2021-11-10
網頁
Python中使用mechanize庫抓取網頁上的表格資料
2024-03-15
Python網頁
藉助代理IP進行網頁抓取的終極指南
2023-03-06
網頁
Laravel 配合 puppeteer 抓取 SPA 頁面
2020-02-17
Laravel
Go抓取網頁資料並存入MySQL和返回json資料
2019-02-16
Go網頁MySqlJSON
Go和JavaScript結合使用：抓取網頁中的影像連結
2023-11-07
GoJavaScript網頁
Python併發程式設計：提高網頁抓取效率實踐指南
2023-10-13
Python程式設計網頁
如何讓Python爬蟲一天抓取100萬張網頁
2019-05-09
Python爬蟲網頁
在 C# 和 JavaScript 之間選擇進行網頁抓取
2024-09-22
C#JavaScript網頁
簡單的網頁登入頁面
2024-04-10
網頁
圖片抓取_千圖網圖片抓取
2021-01-13

騰牛網抓取（單頁）

騰牛網抓取（單頁）

一、完整程式碼

1.1 效果

二、知識點

2.1 xpath解析 中間節點省略

2.2 使用zip遍歷

相關文章

2.1 xpath解析中間節點省略