各大電商平臺關於預製菜品種酸菜魚銷售量

金木大大大發表於2023-11-10

```R

# 匯入需要的包

library(rvest) # 用於網頁抓取

library(tidyverse) # 用於資料處理

library(stringr) # 用於字串處理


# 設定代理資訊

proxy_host <- "

proxy_port <- 8000


# 設定要爬取的網頁

url <- "


# 使用代理資訊進行網頁抓取

page <- read_html(url, proxy = list(http = paste0(" proxy_host, ":" , proxy_port)), encoding = "UTF-8")


# 使用CSS選擇器提取銷售量資訊

sales <- page %>% 

  html_nodes(".sales") %>% 

  html_text()


# 使用正規表示式提取酸菜魚的銷售量

sales_cai_yu <- str_extract(sales, "酸菜魚:(.*)")


# 列印提取的銷售量

print(sales_cai_yu)

```


這個爬蟲程式首先匯入了需要的包,包括`rvest`用於網頁抓取,`tidyverse`用於資料處理,以及`stringr`用於字串處理。然後設定了要爬取的網頁和代理資訊。


接著,使用`read_html`函式透過代理資訊進行網頁抓取,並設定編碼為UTF-8。


然後,使用CSS選擇器`html_nodes`提取出網頁中的銷售量資訊,並使用`html_text`函式將其轉換為字元型。


接著,使用正規表示式`str_extract`提取出酸菜魚的銷售量。


最後,將提取的酸菜魚銷售量列印出來。需要注意的是,這只是一個簡單的示例,實際的網頁結構可能會有所不同,需要根據實際情況調整CSS選擇器和正規表示式。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70032566/viewspace-2994622/,如需轉載,請註明出處,否則將追究法律責任。

相關文章