python爬取北京租房資訊
租房助手
發現官網的篩選方式不能滿足自己的需求,所以爬取相關網站製作出現在的東西來
效果預覽-> 線上預覽
下面進行詳細分析
一.首先爬取起始地和終點地的路線及沿途地鐵站名稱
1.爬取8684.cn的地鐵查詢:
pattern = 'http://bjdt.8684.cn/so.php?k=p2p&q={}&q1={}'
q->起始位置,q1為目標位置。返回的是html頁面。
2.採用scrapy進行xpath解析,提取相關的html標籤和值
- 如提取線路方案列表的xpath表示式
Selector(text=body).xpath(
"//div[@class='iContainer clear']/div[@class='iMain']/div[@class='transferMainShowWrap']/ul[@class='tms-mn tms-project']/li")
.extract()
3.提取出線路方案列表後,針對列表中的每個元素進行提取站點的操作,可參考提取a標籤,但剔除帶有class屬性的html值。
4.將所有的站點放到一個列表中,同時針對列表元素進行去重操作,記得記錄路線描述和距離,可定義相關物件來維護。
二.通過站點查詢租房資訊
1.主要對自如官網進行爬取。
pattern=http://www.ziroom.com/z/nl/z2.html?qwd={}
- qwd可能需要進行urlencode
返回的是html頁面,需要對頁面進行分析,首先提取出總頁數,然後根據總頁數去請求其餘頁面。上面的url附加q引數,q引數為頁面索引,即是單獨頁面連結
2.針對單個頁面提取各個單條專案的資訊。
如提取單個頁面的資訊列表ls = Selector(text=body).xpath("//ul[@id='houseList']/li").extract();
針對列表進行單個處理,提取感興趣的資訊。
3.處理封裝返回。
針對提取的資訊,進行篩選,例如對價格進行篩選,對大小進行篩選,不用做排序。採用前端框架來進行排序。後臺做的處理已經夠多了。
三.接入到公眾號中
可以接入到公眾號中,提高公眾號的影響力,具體的公眾平臺對接請參考訪問github開源專案
相關文章
- python爬蟲--爬取鏈家租房資訊Python爬蟲
- 用python爬取鏈家的租房資訊Python
- 爬蟲實戰——58同城租房資料爬取爬蟲
- 利用requestes\pyquery\BeautifulSoup爬取某租房公寓(深圳市)4755條租房資訊及總結
- 初識Scrapy框架+爬蟲實戰(7)-爬取鏈家網100頁租房資訊框架爬蟲
- python爬蟲——爬取大學排名資訊Python爬蟲
- 一小時入門Python爬蟲,連我都會了!Python爬取租房資料例項Python爬蟲
- 小白學 Python 爬蟲(25):爬取股票資訊Python爬蟲
- python itchat 爬取微信好友資訊Python
- Python爬蟲爬取淘寶,京東商品資訊Python爬蟲
- Python爬蟲實戰:爬取淘寶的商品資訊Python爬蟲
- python-python爬取豆果網(菜譜資訊)Python
- python爬蟲58同城(多個資訊一次爬取)Python爬蟲
- Python爬蟲訓練:爬取酷燃網視訊資料Python爬蟲
- Python3爬取貓眼電影資訊Python
- [Python3]selenium爬取淘寶商品資訊Python
- 如何爬取前程無憂python職位資訊Python
- Python爬取所有人位置資訊——騰訊位置大資料!Python大資料
- Python爬蟲之小說資訊爬取與資料視覺化分析Python爬蟲視覺化
- Python爬取天氣資訊並語音播報Python
- Python筆記:網頁資訊爬取簡介(一)Python筆記網頁
- Java爬蟲-爬取疫苗批次資訊Java爬蟲
- 北京市政百姓信件分析實戰一 (利用python爬取資料)Python
- python爬蟲小專案--飛常準航班資訊爬取variflight(上)Python爬蟲
- 爬蟲Selenium+PhantomJS爬取動態網站圖片資訊(Python)爬蟲JS網站Python
- Python爬取股票資訊,並實現視覺化資料Python視覺化
- Python:爬取疫情每日資料Python
- 淘寶商品資訊爬取
- 房產資料爬取、智慧財產權資料爬取、企業工商資料爬取、抖音直播間資料python爬蟲爬取Python爬蟲
- Python 爬蟲獲取網易雲音樂歌手資訊Python爬蟲
- python爬蟲,獲取中國工程院院士資訊Python爬蟲
- 利用Python爬蟲獲取招聘網站職位資訊Python爬蟲網站
- python實現微博個人主頁的資訊爬取Python
- python 爬取騰訊視訊的全部評論Python
- python爬蟲--招聘資訊Python爬蟲
- 【Python爬蟲實戰】使用Selenium爬取QQ音樂歌曲及評論資訊Python爬蟲
- Python一鍵爬取你所關心的書籍資訊Python
- Python 爬取外文期刊論文資訊(機械 儀表工業)Python