当前位置:   article > 正文

基于大数据的城市租房信息可视化分析系统_基于大数据的租房数据分析系统的设计与实现

基于大数据的租房数据分析系统的设计与实现

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码。

一项目简介

   本项目利用 python 网络爬虫抓取某租房网站的租房信息,完成数据清洗和结构化,存储到数据库中,搭建web系统对租房的面积、朝向、有无地铁、公共交通工具等价格影响因素进行统计分析并可视化展示。

二、数据读取

  功能主要包括:

在这里插入图片描述

三、基于大数据的城市租房信息可视化分析系统

3.1 登录注册

在这里插入图片描述

3.2 租房小区名称关键词抽取并词云分析

在这里插入图片描述

3.3城市不同区域租房数量分布情况

在这里插入图片描述

3.4 城市不同区域租房房价分布散点图

在这里插入图片描述

3.5 不同地区租房房源数与平均租房价格的分布情况

在这里插入图片描述

3.6 城市各区域租房房价格分布箱线图

在这里插入图片描述

四. 汽车数据爬虫

   利用 python 的 request + beautifulsoup 从某租房平台抓取深圳(其他城市修改相应的租房网址即可)的租房数据:

def parse_zu_fang_divs(all_zu_fang_divs):
    house_infoes = []
    for zu_fang_div in all_zu_fang_divs:
        try:
            # 标题
            title = zu_fang_div.select('b.strongbox')[0].text.strip()
            props = zu_fang_div.select('p.details-item.tag')[0].text.strip().split(' ')[0].strip()
            # 室厅,面积,所在楼层
            shiting, mianji, louceng = props.split('|')   # 2室1厅|93平米|中层(共26层)
            address_tag = zu_fang_div.select('address.details-item')[0]
            address = address_tag.text.strip()
            xiaoqu, address = address.split('\n')
            # 小区名称
            xiaoqu = xiaoqu.strip()
            address = address.strip()
            qu, data2 = address.split(' ')
            # 小区所在一级区,二级街道
            first_qu, second_jiedao = qu.split('-')
 
            tags = zu_fang_div.select('p.details-item.bot-tag')[0].text.strip()
            # 标签
            tags = tags.split('\n')
            # 租金
            price = zu_fang_div.select('div.zu-side')[0].text.strip()
 
            house_infoes.append({
                '小区名称': xiaoqu, '小区所在一级区': first_qu, '二级街道': second_jiedao,
                '室厅': shiting, '面积': mianji, '所在楼层': louceng, '标签': tags, '租金': price
            })
        except:
            pass
    return house_infoes
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32

五. 总结

   本项目利用 python 网络爬虫抓取某租房网站的租房信息,完成数据清洗和结构化,存储到数据库中,搭建web系统对租房的面积、朝向、有无地铁、公共交通工具等价格影响因素进行统计分析并可视化展示。
————————————————

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/661502
推荐阅读
相关标签
  

闽ICP备14008679号