python爬取58同城一頁資料

fan_lulu發表於2018-08-04

原文網址 : https://blog.csdn.net/fan_lulu/article/details/81408058

程式碼如下：

from bs4 import BeautifulSoup
import requests

def get_link_from(whos_sells=0):
    urls=[]
    list_view = 'http://xa.58.com/pingbandiannao/{}/pn1/'.format(str(whos_sells))
    wb_data = requests.get(list_view)
    soup = BeautifulSoup(wb_data.text,'lxml')
    if whos_sells == 0:
        for link in soup.select('td.t a.t'):
            urls.append(link.get('href').split('?')[0])
    else:
        for link in soup.select('div.left a.title.t'):
            urls.append(link.get('href'))
    return urls

def get_views_from(url):
    id = url.split('/')[-1].strip('x.shtml')
    api = 'http://jst1.58.com/counter?infoid={}'.format(id)
    js = requests.get(api)
    views = js.text.split('=')[-1]
    return views

def get_info_item(whos_sells):
    urls=get_link_from(whos_sells)
    print(urls)
    for url in urls:
        wb_data = requests.get(url)
        soup = BeautifulSoup(wb_data.text, 'lxml')
        data = {
            'title' : soup.title.text,
            'price' : soup.select('span.price_now i')[0].text if soup.find_all('span','price_now') else None,
            'addr'  : list(soup.select('div.palce_li span i')[0].stripped_strings) if soup.find_all('div','palce_li') else None,
            #也可以為
            #'addr'  : list(soup.select('div.palce_li span i')[0].stripped_strings) if soup.find_all('div',class_='palce_li') else None,
            'cate'  : 'person' if whos_sells == 0 else 'seller',
            'views' : get_views_from(url)
        }
        print(data)

get_info_item(0)
#get_link_from(1)
#get_views_from(url)

當get_info_item()傳入引數為0時，可爬取個人第一頁資料，當傳入引數為1時，按道理說應該爬取商家第一頁資訊，但是結果卻出錯，可能是因為商家資訊爬取時便籤不一樣，導致爬取失敗，後續將會進行程式碼優化

python爬蟲58同城（多個資訊一次爬取）
2018-11-04
Python爬蟲
爬蟲實戰——58同城租房資料爬取
2019-12-04
爬蟲
Python 爬取網頁資料的兩種方法
2023-02-15
Python網頁
不會Python爬蟲？教你一個通用爬蟲思路輕鬆爬取網頁資料
2019-01-08
Python爬蟲網頁
Puppeteer爬取網頁資料
2019-03-22
網頁
Python筆記：網頁資訊爬取簡介（一）
2020-11-11
Python筆記網頁
如何用Python爬資料？（一）網頁抓取
2018-06-27
Python網頁
python爬取換頁_爬蟲爬不進下一頁了，怎麼辦
2020-11-24
Python爬蟲
58同城反爬蟲機制及處理
2020-08-15
爬蟲
房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取
2024-07-11
Python爬蟲
Python：爬取疫情每日資料
2020-02-17
Python
關於python爬取網頁
2021-03-10
Python網頁
Python網路爬蟲第三彈《爬取get請求的頁面資料》
2018-09-14
Python爬蟲
Python 爬取 baidu 股票市值資料
2019-02-16
PythonAI
Python爬取噹噹網APP資料
2020-10-21
PythonAPP
Python爬取CSDN部落格資料
2019-01-03
Python
使用 Python 爬取網站資料
2024-07-27
Python網站
python爬取不到資料的可能原因之一
2018-11-20
Python
python爬取股票資料並存到資料庫
2021-03-29
Python資料庫
python爬取網頁詳細教程
2021-09-11
Python網頁
58同城：聚焦女性職場人求職大資料
2021-03-08
求職大資料
結合LangChain實現網頁資料爬取
2024-07-18
LangChain網頁
58同城：2019年雙十一熱門崗位大資料
2019-11-08
大資料
58同城：2020年雙十一熱門職位大資料
2020-11-06
大資料
58同城：2020年雙十一客服行業大資料
2020-11-10
行業大資料
如何使用python進行網頁爬取?
2020-08-06
Python網頁
python實現微博個人主頁的資訊爬取
2021-01-03
Python
Python爬蟲框架：scrapy爬取高考派大學資料
2019-10-07
Python爬蟲框架
Python爬蟲入門【3】：美空網資料爬取
2019-07-30
Python爬蟲
輕鬆利用Python爬蟲爬取你想要的資料
2021-09-10
Python爬蟲
「無程式碼」高效的爬取網頁資料神器
2021-10-18
網頁
用Jupyter—Notebook爬取網頁資料例項14
2020-12-01
網頁
用Jupyter—Notebook爬取網頁資料例項12
2020-12-01
網頁
爬取子頁
2018-08-24
自定義View-27 仿58同城載入資料動畫
2018-07-15
View動畫
Python 爬取網頁中JavaScript動態新增的內容（一）
2018-09-28
Python網頁JavaScript
Python爬蟲訓練：爬取酷燃網視訊資料
2020-10-23
Python爬蟲
python網路爬蟲（7）爬取靜態資料詳解
2019-06-07
Python爬蟲

python爬取58同城一頁資料

相關文章