当前位置:   article > 正文

爬虫链家7万条数据,告诉你二手房市场的现状_爬取二手房上万条数据

爬取二手房上万条数据

本文分3个篇章,为你解答还原一个真实的合肥二手房市场。

一、数据来源

(一)背景

在登录合肥链家“找房”时,发现链家在合肥接近7万条二手房房源数据可以爬取,且没有太多“反爬”机制。
在这里插入图片描述

且数据字段信息很丰富,包含小区、建成时间、房价、平米、区位等诸多信息。

从用户需求角度思考,二手房市场基本就是“供给决定需求”。在供地减少、中心城区基本开发完善的情况下,存量房也就决定了用户的需求。

因此,我决定写个代码将房源爬取出来,再写个分析报告。说干就干!

在这里插入图片描述

(代码和数据集在公众号后台回复“链家”即可获取)

(二)链家挂牌的房源信息靠谱吗

链家经营多年的“楼盘字典”、“真房源”和“真房价”都确保上架房源的真实性!所以本次房源分析报告对真实市场具有较高吻合度。

(三)数据清洗

1、将房源挂牌价异常的数据删除

2、本次分析集中在合肥市区,进而将四县一市的数据剔除

二、房源数据分析

(一)房价热力图

根据爬取到的房源经纬度和房价,制作一个热力图。
在这里插入图片描述

1、合肥的房价热度整体趋势:东北弱、西南强

2、房价接近5万的三个板块:50中、政务奥体中心、滨湖环湖CBD

选取其中一个房源进行查看,近5万元/平米的房价可以算得上合肥的二手房天花板。

(二)区域颗粒度
在这里插入图片描述

1、2万时代到来:全市二手房均价达到20,353元。

2、区域差异明显:瑶海区均价1.3万,而政务区接近4万。

3、房源供给差异大:高新区和政务区的房源供给较少。其中政务挂牌房源不足2000套,高新区也只接近3000套。

(三)房价区间分布
在这里插入图片描述

虽然房价步入2万时代,但是房源之间的房价方差依然非常大。房价2万以下的房源数量超过3万,占比数量较高。

(四)房源年龄
在这里插入图片描述

大多数用户不选择购买二手房的主要原因是房源年龄大、小区物业管理不善…因此未满2年的次新房常是用户的偏爱,那么这部分房源的分布是怎么样的呢?

全市现存未满两年的次新房数量12,000左右,占比23.6%。

其中本人偏爱的蜀山(毗邻政务和高新)有接近1700套,可以选择的房源也是比较多的。

(五)上架时间
在这里插入图片描述

在现存房源上架时间和数量的分布中,我们可以直观看到第二季度和第三季度新上架房源出现了明显的提高。说明市区多数房主寄希望于从本轮房源上涨中套利。

然而遇到政策收紧,多数房源无法在短期找到合适买家。那么降价也就不足为奇了。这其中若有优质房源,值得大家关注。

三、二手房政策

在“房住不炒”的政策引导下,合肥的房地产市场进入调整期。加上近期银行放款周期延长,二手房“量价齐跌”。在可预见的时间内,合肥的二手房将进入横盘阶段。
在这里插入图片描述

对于二手房的需求用户来说,购买时一定要认准优质资产。选择在地段、配套、品牌等方面更有优势的二手房,更抗跌保值。在遇到房主低价急卖时,可以选择入手。

关注公号,即可获取代码和EXCEL数据

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/192568?site
推荐阅读
相关标签
  

闽ICP备14008679号