我用Python爬取了李滄最近一年多的二手房成交資料得出以下結論

小柒2012發表於2019-04-01

我用Python爬取了李滄最近一年多的二手房成交資料得出以下結論

前言

去年年底,博主有購房的意願,本來是打算在青島市北購房,怎奈工作變動,意向轉移到了李滄,坐等了半年以後,最終選擇在紅島附近購置了期房。

也許一些知道青島紅島的小夥伴會問我,為什麼會跑到那鳥不拉屎的地方去買房子,目前只能是一個字:"賭、賭、賭",重要的事情說三遍。下面來分析一下,我為什麼沒有在李滄買。

爬取資料

爬取了2018年1月份到2019年3月底李滄二手房成交記錄,資料僅限於鏈家,不代表李滄地區的全部資料,但是我覺得應該對大家有一定的參考意義。

建立基本的資料庫:

CREATE TABLE `house` (
   `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '主鍵',
   `url` varchar(50) NOT NULL COMMENT '網路訪問地址',
   `listed_price` double NOT NULL COMMENT '掛牌價格',
   `completion_date` date NOT NULL COMMENT '成交日期',
   `transaction_cycle` int(11) NOT NULL COMMENT '成交週期',
   `modify_price` int(11) NOT NULL COMMENT '調價次數',
   `square_metre` double NOT NULL COMMENT '建築面積',
   `unit_price` double NOT NULL COMMENT '單價',
   `total_price` double NOT NULL COMMENT '總價',
   `age_completion` int(11) NOT NULL COMMENT '建成年代',
   `community_name` varchar(50) NOT NULL COMMENT '所在小區',
   PRIMARY KEY (`id`)
 ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8
複製程式碼

爬取程式碼:

__author__ = "小柒"
__blog__ = "https://blog.52itstyle.vip/"
import requests
import time
# 匯入檔案操作庫
import os
import re
import bs4
from bs4 import BeautifulSoup
import sys
from util.mysql_DBUtils import mysql


# 寫入資料庫
def write_db(param):
    try:
        sql = "insert into house (url,listed_price,transaction_cycle,modify_price," \
              "square_metre,unit_price,total_price,age_completion,community_name,completion_date) "
        sql = sql + "VALUES(%(url)s,%(listed_price)s, %(transaction_cycle)s,%(modify_price)s,"
        sql = sql + "%(square_metre)s,%(unit_price)s,%(total_price)s," \
                    "%(age_completion)s,%(community_name)s,%(completion_date)s)"
        mysql.insert(sql, param)
    except Exception as e:
        print(e)


# 主方法
def main():
    # 給請求指定一個請求頭來模擬chrome瀏覽器
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 '
                             '(KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'}
    page_max = 24
    # 爬取地址
    for i in range(1, int(page_max) + 1):
        print("第幾頁:" + str(i))
        if i == 1:
            house = 'https://qd.lianjia.com/chengjiao/licang/'
        else:
            house = 'https://qd.lianjia.com/chengjiao/licang/pg'+str(i)
        res = requests.get(house, headers=headers)
        soup = BeautifulSoup(res.text, 'html.parser')
        li_max = soup.find('ul', class_='listContent').find_all('li')
        for li in li_max:
            try:
                house_param = {}
                # 所在小區
                community = li.find('div', class_='title').text
                community_name = community.split(" ")[0]
                house_param['community_name'] = community_name
                # 成交地址
                title_src = li.find('a').attrs['href']
                house_param['url'] = title_src
                res = requests.get(title_src, headers=headers)
                soup = BeautifulSoup(res.text, 'html.parser')
                # --------------------------------------------------------#
                # 成交日期
                completion_date = soup.find('div', class_='house-title').find('span').text
                completion_date = completion_date.split(" ")[0]
                completion_date = completion_date.replace(".", "-")
                house_param['completion_date'] = completion_date
                # 掛牌價格
                listed_price = soup.find('div', class_='msg').find_all('span')[0].find('label').text
                house_param['listed_price'] = listed_price
                # 成交週期
                transaction_cycle = soup.find('div', class_='msg').find_all('span')[1].find('label').text
                house_param['transaction_cycle'] = transaction_cycle
                # 調價次數
                modify_price = soup.find('div', class_='msg').find_all('span')[2].find('label').text
                house_param['modify_price'] = modify_price
                # 建築面積
                square_metre = soup.find('div', class_='content').find("ul").find_all('li')[2].text
                square_metre = re.findall(r'-?\d+\.?\d*e?-?\d*?', square_metre)[0]
                house_param['square_metre'] = square_metre
                # 總價
                total_price = soup.find('span', class_='dealTotalPrice').find('i').text
                house_param['total_price'] = total_price
                # 單價
                unit_price = soup.find('b').text
                house_param['unit_price'] = unit_price
                # 建築年代
                age_completion = soup.find('div', class_='content').find("ul").find_all('li')[7].text
                age_completion = re.findall(r'-?\d+\.?\d*e?-?\d*?', age_completion)[0]
                house_param['age_completion'] = age_completion
                write_db(house_param)
            except Exception as e:
                print(e)
        mysql.end("commit")
    mysql.dispose()


if __name__ == '__main__':
    main()

複製程式碼

通過資料爬取,一共找到了706套二手成交房。

分析資料

直奔主題,資料分析下,大家比較關心的價格問題,以下是2019年1月-3月的二手房成交量以及成交價格:

位置 成交量 單價
李滄 124 21100

同比去年的二手房成交量以及成交價格:

位置 成交量 單價
李滄 277 21306

嚇的博主趕緊用計算器認認真真,仔仔細細的核算了三遍,才敢寫下這幾個數字,同比去年,單價整整降了206人民幣,此處有掌聲。再看一下成交量,相比去年少了足足一半之多,相信那124套房子也是賣家忍痛降了206人民幣才賣出去的吧!

好了,再看一下大家比較關心的成交週期,2019年1月-3月的二手房成交量以及成交週期:

位置 成交量 成交週期(天)
李滄 124 96

同比去年的二手房成交量以及成交週期:

位置 成交量 成交週期(天)
李滄 277 83

不得不說,相比去年房子的確是難賣了。

小結

很多同事,同學,13、14年就已經上車了,那時李滄1w不到,再看看現在?不想看,沒眼看,不能看。最終沒在李滄買房,也不是買不起,只是看不到降的希望,相對壓力又大一些,而且,也不想把家庭所有的積蓄都賭在這裡。

最後,對於剛需就是一個建議,買早買,有房和沒房看一個城市是不一樣的,努力賺錢的最大意義就是提升你的幸福感。活在人間不食人間煙火?真以為自己是神仙?有些東西一說的實際一點真的是會傷到某些人的心,祝你們用鍵盤戰勝一切。

相關程式碼:gitee.com/52itstyle/P…

相關文章