爬取市場價格,全國農產品商務資訊公共服務平臺
宣告:程式碼僅作學習交流用途,程式碼分享者與創作者不承擔任何由他人惡意執行而導致的責任,勿擅自修改限制頻率的引數,勿惡意攻擊網頁,請學習瀏覽者遵守社會公德與法律秩序,爬蟲導致的網頁崩潰等損失由計算機操作者負全部責任,造成嚴重後果的需要承擔刑事責任
全國農產品商務資訊公共服務平臺爬取
import requests
from fake_useragent import UserAgent
from lxml import etree
from time import sleep
from random import randint
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.by import By
#from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from multiprocessing import Process
import threading
import re
from tqdm import tqdm
from selenium.webdriver.chrome.options import Options
#url_base = 'https://nc.mofcom.gov.cn/jghq/priceList?craftName=%E7%8C%AA%E8%82%89'豬肉
#url_base = 'https://nc.mofcom.gov.cn/jghq/priceList?craftName=%E7%BE%8A%E8%82%89'羊肉
#url_base = 'https://nc.mofcom.gov.cn/jghq/priceList?craftName=%E7%8E%89%E7%B1%B3'#玉米
#url_base = 'https://nc.mofcom.gov.cn/jghq/priceList?craftName=%E7%99%BD%E6%9D%A1%E9%B8%A1'#雞肉
url_base = 'https://nc.mofcom.gov.cn/jghq/priceList?craftName=%E9%B8%A1%E8%9B%8B'#雞蛋
options = Options()
UA = UserAgent().edge
options.add_argument('''user-agent='{}' '''.format(UA))
# options.add_argument('''proxy-server={}'''.format(proxy)) # 124.236.111.11:80
options.binary_location = "C:\\Program Files\\Google\\Chrome\\Application\\chrome.exe"
edge = webdriver.Chrome(options=options) # executable_path="D:\Program Files\python3.7\chromedriver.exe"
edge.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
"source": """
Object.defineProperty(navigator, 'webdriver',{
get: () => undefined
})
"""
})
edge = webdriver.Chrome(options=options)
edge.get(url_base)
edge.find_element(By.XPATH, '//*[@id="eudName"]').click()
edge.find_element(By.XPATH, '/html/body/div[3]/div[1]/a[2]').click()
edge.find_element(By.XPATH, '/html/body/div[3]/div[2]/ul[2]/li[2]').click()
edge.find_element(By.XPATH, '//*[@id="searchForm"]/div/div[3]/div[1]/div/input').click()
#edge.find_element(By.XPATH, '//*[@id="searchForm"]/div/div[3]/div[1]/dl/dd[4]').click()
edge.find_element(By.XPATH, '//*[@id="searchForm"]/div/div[3]/div[1]/dl/dd[3]').click()
#edge.find_element(By.XPATH, '//*[@id="layui-laydate1"]/div[1]/div[2]/table/tbody/tr[1]/td[6]').click()
#edge.find_element(By.XPATH, '//*[@id="layui-laydate1"]/div[2]/div[2]/table/tbody/tr[1]/td[2]').click()
edge.find_element(By.XPATH, '//*[@id="searchBtn"]').click()
data_all = []
product_all = []
price_all = []
market_all=[]
sleep(2)
while True:
html = edge.page_source
e = etree.HTML(html)
data = e.xpath('''//table[@class='table-01 mt30']/tbody[1]/tr/td[1]/text()''')
product = e.xpath('''//table[@class='table-01 mt30']/tbody[1]/tr/td[2]/span/text()''')
price = e.xpath('''//*[@id="showList"]/table/tbody/tr/td[3]/span/text()''')
market = e.xpath('''//*[@id="showList"]/table/tbody/tr/td[4]/a/text()''')
print(data)
data_all = data_all + data
product_all = product_all + product
price_all = price_all + price
market_all = market_all + market
print(data_all)
sleep(5)
if e.xpath('''//*[@id="pageFooter"]/a[last()-1]/text()''') == ['下一頁']:
edge.find_element(By.XPATH, '''/html/body/div[2]/div/div[1]/div[3]/a[last()-1]''').click()#//*[@id="pageFooter"]/a[9]#/html/body/div[2]/div/div[1]/div[3]/a[9]
else:
break
# edge.find_element(By.XPATH, '''//*[@id="pageFooter"]/a[last()-1]''').click()
all_info = {
'資料年月': data_all,
'產品': product_all,
'價格': price_all,
'市場': market_all
}
outdata = pd.DataFrame(all_info)
outdata.to_csv('C:\\Users\\Admin\\PycharmProjects\\untitled\\雞蛋價格.csv', encoding='GBK')
相關文章
- 資訊化實戰展示系列4 **市企業公共服務平臺
- 區塊鏈農產品溯源系統開發,區塊鏈公共服務平臺建設方案區塊鏈
- 產品解讀 | 資料服務平臺:KDP
- 區塊鏈農產品溯源系統開發解決方案,區塊鏈公共服務平臺建設區塊鏈
- IDC:2020年中國一體化政務服務平臺解決方案市場廠商市場份額
- IDC:2020中國一體化政務服務平臺解決方案市場廠商份額
- 向量檢索服務產品規格
- 農小蜂:2021年全國鮮活農產品批發價格行情資料分析報告(附下載)
- 資訊化實戰展示系列5**市**區資料服務平臺
- 招聘服務平臺商業模式模式
- 2023年中國主要公共雲容器服務廠商市場份額(附原資料表)
- “數商興農”:從阿里平臺看農產品電商高質量發展阿里
- 2023年全球主要公共雲服務廠商市場份額(附原資料表)
- 雲從科技釋出國家人工智慧基礎資源公共服務平臺人工智慧
- 聯合國糧農組織:2024年農產品市場狀況
- 本地生活服務平臺加盟市場前景如何,優勢在哪?
- 服務網格 ASM 8 月產品動態ASM
- 獲取AFP服務資訊
- 中國互金協會上線移動金融可信公共服務平臺
- 商業融資專案(智慧商城+配送服務平臺)
- 區塊鏈農產品追溯管理系統開發,區塊鏈底層服務平臺建設方案區塊鏈
- 房產服務平臺網站的商業模式是什麼網站模式
- 鴻蒙推送服務公共資訊模組指南鴻蒙
- Stataista:中國社交電子商務市場價值3千億美元AI
- 2023年中國主要政務公共雲廠商市場份額(附原資料表)
- 2021年中國公共雲託管安全服務市場份額(附原資料表)
- 聯合國糧農組織:2022年農產品市場狀況報告
- 大家信夫:閉環商務信用體系服務平臺
- 售後服務不是國產資料庫廠商的負資產資料庫
- 中睿天下獲得“北京市中小企業公共服務示範平臺”稱號
- IDC MarketScape:2019中國AI雲服務市場廠商評估AI
- 2023年中國主要政務公共雲SaaS廠商市場份額(附原資料表)
- 出行平臺採集機票價格資訊
- 房產服務平臺網站需要哪些資質證書網站
- 阿里雲服務網格 ASM 9 月份產品動態阿里ASM
- 阿里雲服務網格 ASM 10 月份產品動態阿里ASM
- BeetleX大資料之產品分析服務大資料
- 授牌 | 綠盟科技榮獲“北京市中小企業公共服務示範平臺”認定