python爬取58同城一頁資料
程式碼如下:
from bs4 import BeautifulSoup
import requests
def get_link_from(whos_sells=0):
urls=[]
list_view = 'http://xa.58.com/pingbandiannao/{}/pn1/'.format(str(whos_sells))
wb_data = requests.get(list_view)
soup = BeautifulSoup(wb_data.text,'lxml')
if whos_sells == 0:
for link in soup.select('td.t a.t'):
urls.append(link.get('href').split('?')[0])
else:
for link in soup.select('div.left a.title.t'):
urls.append(link.get('href'))
return urls
def get_views_from(url):
id = url.split('/')[-1].strip('x.shtml')
api = 'http://jst1.58.com/counter?infoid={}'.format(id)
js = requests.get(api)
views = js.text.split('=')[-1]
return views
def get_info_item(whos_sells):
urls=get_link_from(whos_sells)
print(urls)
for url in urls:
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text, 'lxml')
data = {
'title' : soup.title.text,
'price' : soup.select('span.price_now i')[0].text if soup.find_all('span','price_now') else None,
'addr' : list(soup.select('div.palce_li span i')[0].stripped_strings) if soup.find_all('div','palce_li') else None,
#也可以為
#'addr' : list(soup.select('div.palce_li span i')[0].stripped_strings) if soup.find_all('div',class_='palce_li') else None,
'cate' : 'person' if whos_sells == 0 else 'seller',
'views' : get_views_from(url)
}
print(data)
get_info_item(0)
#get_link_from(1)
#get_views_from(url)
當get_info_item()傳入引數為0時,可爬取個人第一頁資料,當傳入引數為1時,按道理說應該爬取商家第一頁資訊,但是結果卻出錯,可能是因為商家資訊爬取時便籤不一樣,導致爬取失敗,後續將會進行程式碼優化
相關文章
- python爬蟲58同城(多個資訊一次爬取)Python爬蟲
- 爬蟲實戰——58同城租房資料爬取爬蟲
- Python 爬取網頁資料的兩種方法Python網頁
- 不會Python爬蟲?教你一個通用爬蟲思路輕鬆爬取網頁資料Python爬蟲網頁
- Puppeteer爬取網頁資料網頁
- Python筆記:網頁資訊爬取簡介(一)Python筆記網頁
- 如何用Python爬資料?(一)網頁抓取Python網頁
- python爬取換頁_爬蟲爬不進下一頁了,怎麼辦Python爬蟲
- 58同城 反爬蟲機制及處理爬蟲
- 房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取Python爬蟲
- Python:爬取疫情每日資料Python
- 關於python爬取網頁Python網頁
- Python網路爬蟲第三彈《爬取get請求的頁面資料》Python爬蟲
- Python 爬取 baidu 股票市值資料PythonAI
- Python爬取噹噹網APP資料PythonAPP
- Python爬取CSDN部落格資料Python
- 使用 Python 爬取網站資料Python網站
- python爬取不到資料的可能原因之一Python
- python爬取股票資料並存到資料庫Python資料庫
- python爬取網頁詳細教程Python網頁
- 58同城:聚焦女性職場人求職大資料求職大資料
- 結合LangChain實現網頁資料爬取LangChain網頁
- 58同城:2019年雙十一熱門崗位大資料大資料
- 58同城:2020年雙十一熱門職位大資料大資料
- 58同城:2020年雙十一客服行業大資料行業大資料
- 如何使用python進行網頁爬取?Python網頁
- python實現微博個人主頁的資訊爬取Python
- Python爬蟲框架:scrapy爬取高考派大學資料Python爬蟲框架
- Python爬蟲入門【3】:美空網資料爬取Python爬蟲
- 輕鬆利用Python爬蟲爬取你想要的資料Python爬蟲
- 「無程式碼」高效的爬取網頁資料神器網頁
- 用Jupyter—Notebook爬取網頁資料例項14網頁
- 用Jupyter—Notebook爬取網頁資料例項12網頁
- 爬取子頁
- 自定義View-27 仿58同城載入資料動畫View動畫
- Python 爬取網頁中JavaScript動態新增的內容(一)Python網頁JavaScript
- Python爬蟲訓練:爬取酷燃網視訊資料Python爬蟲
- python網路爬蟲(7)爬取靜態資料詳解Python爬蟲