Python爬蟲實戰:爬取淘寶的商品資訊

dav2100發表於2021-09-11

Python爬蟲實戰:爬取淘寶的商品資訊

現如今,我們已經離不開網上購物,作為阿里的發家之作淘寶成為我們現在手機app中的必備軟體,尤其是女生,幾乎每天都要開啟淘寶瀏覽商品資訊,其實使用python可以透過爬蟲可以實現爬取淘寶的商品資訊,本文將分步驟向大家介紹Python爬蟲爬取淘寶的商品資訊的過程。

1、匯入需要的包

import timefrom bs4 
import BeautifulSoupfrom selenium 
import webdriver

2、編輯淘寶資料抓取的函式邏輯

   # 編輯淘寶資料抓取的函式邏輯
    """
    1.登入淘寶
    2.首頁
    3.指定商品的搜尋資訊
    4.提取指定商品的金額、購買人數、商鋪地址、商品名稱、商品圖片
    """

3、開啟淘寶網頁,並掃碼登陸點選淘寶網首頁

    def login_info(self):
        # 1.開啟網頁
        self.browser.get(self.url)

        # 2.透過掃碼的形式去登入淘寶賬號
        if self.browser.find_element_by_xpath('//*[@id="login"]/div[1]/i'):
            self.browser.find_element_by_xpath('//*[@id="login"]/div[1]/i').click()
        # 讓程式等待休眠5秒,透過手機掃碼登入
        time.sleep(8)

        # 3.點選淘寶網首頁
        taobao_index = self.browser.find_element_by_xpath('//*[@id="J_SiteNavHome"]/div/a')
        taobao_index.click()
        time.sleep(1)

4、自動的在淘寶首頁中輸入自己想要搜尋的商品名稱,並且自動點選搜尋

        search_input = self.browser.find_element_by_xpath('//*[@id="q"]')
        shop_name = input("請輸入你想搜尋的商品名稱:")
        search_input.send_keys(shop_name)
        time.sleep(0.5)
        search_submit = self.browser.find_element_by_xpath('//*[@id="J_TSearchForm"]/div[1]/button')
        search_submit.click()

5、獲取商品資訊

 # 商品金額
                shop_price_data = shop_data.find_all('div', class_='price g_price g_price-highlight')
                for shop_price in shop_price_data:
                    shop_price_list.append(shop_price.text.strip())

                # 購買人數
                shop_people_number_data = shop_data.find_all('div','deal-cnt')
                for shop_people_number in shop_people_number_data:
                    shop_people_list.append(shop_people_number.text)

                # 店鋪地區
                shop_location_data = shop_data.find_all('div','location')
                for shop_location in shop_location_data:
                    shop_location_list.append(shop_location.text)

以上就是Python爬蟲爬取淘寶的商品資訊的分步介紹,大家可以嘗試看看喲~

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/4479/viewspace-2830754/,如需轉載,請註明出處,否則將追究法律責任。

相關文章