python爬取北京租房資訊

CC的小站發表於2018-05-18

原文網址 : https://blog.csdn.net/zcc1995/article/details/80365144

Python

租房助手

發現官網的篩選方式不能滿足自己的需求，所以爬取相關網站製作出現在的東西來

效果預覽-> 線上預覽

下面進行詳細分析

一.首先爬取起始地和終點地的路線及沿途地鐵站名稱

1.爬取8684.cn的地鐵查詢:
pattern = 'http://bjdt.8684.cn/so.php?k=p2p&q={}&q1={}'

q->起始位置，q1為目標位置。返回的是html頁面。

2.採用scrapy進行xpath解析，提取相關的html標籤和值
如提取線路方案列表的xpath表示式

            Selector(text=body).xpath(
            "//div[@class='iContainer clear']/div[@class='iMain']/div[@class='transferMainShowWrap']/ul[@class='tms-mn tms-project']/li")
            .extract()

3.提取出線路方案列表後，針對列表中的每個元素進行提取站點的操作，可參考提取a標籤，但剔除帶有class屬性的html值。

4.將所有的站點放到一個列表中，同時針對列表元素進行去重操作，記得記錄路線描述和距離，可定義相關物件來維護。

二.通過站點查詢租房資訊

1.主要對自如官網進行爬取。

pattern=http://www.ziroom.com/z/nl/z2.html?qwd={}

qwd可能需要進行urlencode
返回的是html頁面，需要對頁面進行分析，首先提取出總頁數，然後根據總頁數去請求其餘頁面。上面的url附加q引數，q引數為頁面索引，即是單獨頁面連結

2.針對單個頁面提取各個單條專案的資訊。
如提取單個頁面的資訊列表
```
 ls = Selector(text=body).xpath("//ul[@id='houseList']/li").extract();
```
針對列表進行單個處理，提取感興趣的資訊。

3.處理封裝返回。
針對提取的資訊，進行篩選，例如對價格進行篩選，對大小進行篩選，不用做排序。採用前端框架來進行排序。後臺做的處理已經夠多了。

三.接入到公眾號中

可以接入到公眾號中，提高公眾號的影響力，具體的公眾平臺對接請參考訪問github開源專案

python爬蟲--爬取鏈家租房資訊
2020-05-16
Python爬蟲
用python爬取鏈家的租房資訊
2020-10-29
Python
爬蟲實戰——58同城租房資料爬取
2019-12-04
爬蟲
利用requestes\pyquery\BeautifulSoup爬取某租房公寓(深圳市)4755條租房資訊及總結
2020-11-22
初識Scrapy框架+爬蟲實戰(7)-爬取鏈家網100頁租房資訊
2018-06-12
框架爬蟲
python爬蟲——爬取大學排名資訊
2019-08-02
Python爬蟲
一小時入門Python爬蟲，連我都會了！Python爬取租房資料例項
2019-08-02
Python爬蟲
小白學 Python 爬蟲（25）：爬取股票資訊
2019-12-24
Python爬蟲
python itchat 爬取微信好友資訊
2018-06-02
Python
Python爬蟲爬取淘寶，京東商品資訊
2020-02-11
Python爬蟲
Python爬蟲實戰：爬取淘寶的商品資訊
2021-09-11
Python爬蟲
python-python爬取豆果網（菜譜資訊）
2019-01-22
Python
python爬蟲58同城（多個資訊一次爬取）
2018-11-04
Python爬蟲
Python爬蟲訓練：爬取酷燃網視訊資料
2020-10-23
Python爬蟲
Python3爬取貓眼電影資訊
2020-11-06
Python
[Python3]selenium爬取淘寶商品資訊
2021-09-09
Python
如何爬取前程無憂python職位資訊
2021-09-11
Python
Python爬取所有人位置資訊——騰訊位置大資料！
2020-11-13
Python大資料
Python爬蟲之小說資訊爬取與資料視覺化分析
2021-01-09
Python爬蟲視覺化
Python爬取天氣資訊並語音播報
2020-11-17
Python
Python筆記：網頁資訊爬取簡介（一）
2020-11-11
Python筆記網頁
Java爬蟲-爬取疫苗批次資訊
2024-06-03
Java爬蟲
北京市政百姓信件分析實戰一（利用python爬取資料）
2024-09-06
Python
python爬蟲小專案--飛常準航班資訊爬取variflight（上）
2019-03-23
Python爬蟲
爬蟲Selenium+PhantomJS爬取動態網站圖片資訊（Python）
2018-03-24
爬蟲JS網站Python
Python爬取股票資訊，並實現視覺化資料
2020-09-25
Python視覺化
Python：爬取疫情每日資料
2020-02-17
Python
淘寶商品資訊爬取
2020-12-20
房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取
2024-07-11
Python爬蟲
Python 爬蟲獲取網易雲音樂歌手資訊
2019-03-04
Python爬蟲
python爬蟲，獲取中國工程院院士資訊
2021-12-04
Python爬蟲
利用Python爬蟲獲取招聘網站職位資訊
2021-08-09
Python爬蟲網站
python實現微博個人主頁的資訊爬取
2021-01-03
Python
python 爬取騰訊視訊的全部評論
2021-02-17
Python
python爬蟲--招聘資訊
2018-11-03
Python爬蟲
【Python爬蟲實戰】使用Selenium爬取QQ音樂歌曲及評論資訊
2021-03-24
Python爬蟲
Python一鍵爬取你所關心的書籍資訊
2019-03-05
Python
Python 爬取外文期刊論文資訊（機械儀表工業）
2018-06-19
Python

python爬取北京租房資訊

租房助手

下面進行詳細分析

相關文章