如何用 Python 一鍵查房價?看來我還是買不起房啊!
在這全民買房的時代,有一項技能我覺得是程式設計師應該要配備的,無論近期要買或是不買,還是要適當的關注房價走向的。我也喜歡瀏覽房價,但是在網頁裡看得眼花繚亂的,程式設計師就該用程式設計師的方式看嘛!
於是我用python+selenium來抓取鏈家房資料,selenium自動化優點是完全可以模擬人工操作網頁,而且相對其他爬蟲不用寫請求頭,例如直接request的。
前期準備
1、安裝selenium
命令列:pip install selenium 敲回車
2、下載chromedriver對應的版本:
http://chromedriver.storage.googleapis.com/index.html

直接放在Python的Scripts目錄下就可以不用配置變數了,而且也不用宣告路徑
(後面會說)
3、安裝pyquery:

命令列:pip install pyquery
4、安裝pymysql
命令列:pip install pymysql

網頁分析
我們不用宣告請求頭的引數了,只要我們拿到URL,指哪爬哪!
此次抓取的資料如下:

開啟開發者工具,谷歌瀏覽器按F12

發現每個小區的售房資訊都在ul下的li標籤裡,程式碼如下:

第一步拿到html結構,然後用pyquery解析遍歷li標籤,我使用了items()方法
接著提取小區名稱,找到a標籤的class:

提取房類的文字,span標籤下面:

其他的Text文字都是這樣的方法提取
提醒的一點就是,需要判斷一下ul的class,防止有時候網路載入的問題,導致發生錯誤。
模擬滾動
每跳轉一頁就滾動一下滾動條,這樣做的有好處是有些時候是非同步載入的,例如檢視評論:
這裡可以根據個人不同來定義,我這裡以800來滾動。
然後是點選下一頁的動作,網頁有下一頁的選項。一些其他的小動作,可以自己新增哦!
資料儲存
我這裡用mysql存放資料

資料展示:

在這全民買房的時代,有一項技能我覺得是程式設計師應該要配備的,無論近期要買或是不買,還是要適當的關注房價走向的。我也喜歡瀏覽房價,但是在網頁裡看得眼花繚亂的,程式設計師就該用程式設計師的方式看嘛!
於是我用python+selenium來抓取鏈家房資料,selenium自動化優點是完全可以模擬人工操作網頁,而且相對其他爬蟲不用寫請求頭,例如直接request的。
前期準備
1、安裝selenium
命令列:pip install selenium 敲回車
2、下載chromedriver對應的版本:
http://chromedriver.storage.googleapis.com/index.html

直接放在Python的Scripts目錄下就可以不用配置變數了,而且也不用宣告路徑
(後面會說)
3、安裝pyquery:
命令列:pip install pyquery
4、安裝pymysql
命令列:pip install pymysql

網頁分析
我們不用宣告請求頭的引數了,只要我們拿到URL,指哪爬哪!
此次抓取的資料如下:

開啟開發者工具,谷歌瀏覽器按F12

發現每個小區的售房資訊都在ul下的li標籤裡,程式碼如下:

第一步拿到html結構,然後用pyquery解析遍歷li標籤,我使用了items()方法
接著提取小區名稱,找到a標籤的class:

提取房類的文字,span標籤下面:

其他的Text文字都是這樣的方法提取
提醒的一點就是,需要判斷一下ul的class,防止有時候網路載入的問題,導致發生錯誤。
模擬滾動
每跳轉一頁就滾動一下滾動條,這樣做的有好處是有些時候是非同步載入的,例如檢視評論:

這裡可以根據個人不同來定義,我這裡以800來滾動。
然後是點選下一頁的動作,網頁有下一頁的選項。一些其他的小動作,可以自己新增哦!
資料儲存
我這裡用mysql存放資料

資料展示:

進群:960410445 即可獲取數十套PDF!
相關文章
- 工作一兩年的程式設計師,有點錢,買房還是買車?程式設計師
- 看來我是真的不適合華為系的。。。
- 我快買不起 PS5 遊戲了遊戲
- 來啊~一起敲一個chrome擴充套件Chrome套件
- 明明花了大價錢,為什麼你的CMDB還是用不起來?
- 我不結婚,不生子,不買房,倘若能活到退休,我怎麼解決養老問題?
- 馬雲、雷軍等IT大佬談年輕人是否買房:未來房子如蔥
- 貸還是不貸:如何用Python和機器學習幫你決策?Python機器學習
- @Summer 這是BUG還是我姿勢不對啊?編輯文章草稿,然後列表裡沒了?
- Python學習起來難不難?Python
- 我發現買不起自己出版的圖書了,這到底是咋回事?
- 作為一個95後 我為什麼還買機械鍵盤
- 都說很簡單的Hogan,還是得看案例才能懂啊HOG
- 被鶴崗買房鼓勵,我帶上6萬來到另一小城
- 未來一線城市哪個房價最高?
- 起量是玄學嗎?——從上帝視角看買量
- 一起來學習如何用 Node 來製作 CLI
- 荷蘭國際集團:調查顯示38%歐洲人買不起房
- 這種題都做不出來我還打個集貿的 OI 啊
- 房住不炒,來真的了?
- 我決定暫時放棄Onethink了,開發起來太累,還是用ThinkPHP吧PHP
- 買黃金,還是買比特幣?比特幣
- 日本創造女性機器人具備女友一切功能 網友:富人不需要,窮人買不起啊!機器人
- 我去,你竟然還不會用 Java final 關鍵字Java
- Python 來算算一線城市的二手房價格指數相關性Python
- 有類似 比心 陪玩的小程式原始碼的朋友,拿出來我們一起研究啊原始碼
- 「PS5」即將到來:你是看好還是看衰?
- MCU漲價的主要因素還得從供需來看
- 房價在手,天下我有 --反手就擼一個爬蟲(始)爬蟲
- 房價在手,天下我有 --反手就擼一個爬蟲(終)爬蟲
- 房價在手,天下我有 –反手就擼一個爬蟲(始)爬蟲
- 快過年了 今年大家過的怎麼樣啊 工作還 OK 嗎 漲薪了嗎 小目標實現了嗎 我今年過的不順利啊大家一起加加油吧
- 售價16.58萬起,增配不增價,2024款哈弗猛龍硬核來襲
- 人生苦短,我選Python,C++,還是Java?PythonC++Java
- 技術大佬:我去,你竟然還不會用 this 關鍵字
- python 中用什麼鍵縮排 —— tab 還是空格?Python
- 速來圍觀!看小夥是如何用python視覺化各城市擁堵情況的Python視覺化
- 我讓chatGPT用PHP寫一個MVC框架,不僅寫出來,還能跑!ChatGPTPHPMVC框架