抓取金投網文字資料(xpath練習)

随风小屋發表於2024-08-07

抓取金投網文字資料(xpath練習)

建立時間:2024年8月5日

一、完整程式碼

import requests
from lxml import etree

header = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/125.0.0.0 Safari/537.36 Edg/125.0.0.0'
}
url = 'https://cang.cngold.org/c/2024-05-21/c9310686.html'
res = requests.get(url=url, headers=header)
text = res.content.decode()
tree = etree.HTML(text)
text = tree.xpath('//div[@class="article_con"]//text()')
print(text)

1.1 效果

二、程式碼講解

2.1 主要是分析文字在什麼地方

f12開啟網站。--》選擇元素--》選擇檢查---》然後滑鼠放在需要抓取的內容,即可看到頁面程式碼對應位置,然後使用下面的xath解析

具體的地址:可先在元素介面使用 ctrl + f ,輸入寫的xpath檢驗是否正確。

相關文章