Javascript抓取京東、淘寶商品資料

Noah_WB發表於2023-10-19

隨著網際網路的發展,越來越多的商品資訊被髮布在各大電商平臺上,如京東、淘寶等。這些平臺上的商品資訊對於消費者來說是非常重要的,可以幫助他們瞭解商品的價格、詳情和評價等資訊。而對於商家來說,瞭解競爭對手的商品資訊也是至關重要的。因此,抓取京東、淘寶商品資料成為了一種常見的需求。本文將介紹如何使用JavaScript來抓取京東、淘寶的商品資料。

一、抓取京東商品資料

  1. 分析京東商品頁面結構

首先,我們需要分析京東商品頁面的結構,以便找到我們需要的資料。開啟京東網站並搜尋一個商品,進入商品詳情頁後,我們可以使用瀏覽器的開發者工具來檢視頁面結構。

  1. 使用JavaScript抓取資料

透過分析頁面結構,我們可以使用JavaScript來抓取需要的資料。以下是一個簡單的示例程式碼:

const puppeteer = require('puppeteer');
async function getProductInfo(url) {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(url);
  // 獲取商品標題
  const title = await page.$eval('.sku-name', el => el.innerText);
  // 獲取商品價格
  const price = await page.$eval('.p-price', el => el.innerText);
  await browser.close();
  return { title, price };
}

以上程式碼中,我們使用了Puppeteer庫來模擬使用者操作,獲取商品頁面的標題和價格資訊。這裡我們透過選擇器 .sku-name.p-price 來定位頁面元素,並使用 innerText 屬性獲取元素的文字內容。

二、抓取淘寶商品資料

  1. 分析淘寶商品頁面結構

與京東類似,我們也需要分析淘寶商品頁面的結構,以便找到我們需要的資料。開啟淘寶網站並搜尋一個商品,進入商品詳情頁後,我們可以使用瀏覽器的開發者工具來檢視頁面結構。

  1. 使用JavaScript抓取資料

透過分析頁面結構,我們也可以使用JavaScript來抓取淘寶商品資料。以下是一個簡單的示例程式碼:

const puppeteer = require('puppeteer');
async function getProductInfo(url) {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.goto(url);
  // 獲取商品標題
  const title = await page.$eval('.J_Title', el => el.innerText);
  // 獲取商品價格
  const price = await page.$eval('.tm-price', el => el.innerText);
  await browser.close();
  return { title, price };
}
```以上程式碼中,我們同樣使用了Puppeteer庫來獲取淘寶商品頁面的標題和價格資訊。這裡我們透過選擇器 `.J_Title` 和 `.tm-price` 來定位頁面元素,並使用 `innerText` 屬性獲取元素的文字內容。
總結
透過以上的示例程式碼,我們可以看到使用JavaScript來抓取京東、淘寶商品資料是可行的。但是需要注意的是,這種行為可能會涉及到網站的使用協議和法律法規,因此在進行資料抓取前需要確保合法合規。同時,不同的電商平臺頁面結構可能存在差異,需要根據具體情況進行適當的調整和最佳化。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70026910/viewspace-2989966/,如需轉載,請註明出處,否則將追究法律責任。

相關文章