当前位置:   article > 正文

Python爬取链家房价信息_python爬取链家租房信息的区域,小区名,价格,户型,面积信息

python爬取链家租房信息的区域,小区名,价格,户型,面积信息

房子问题近些年来越来越受到大家的关注,要了解近些年的房价,首先就要获取网上的房价信息,我们以链家网上出售的房价信息为例,将数据爬取下来并存储起来。

这次信息的爬取我们依然采取requests-Beautiful Soup的线路来爬取链家网上的出售房的信息。需要安装好anaconda,并保证系统中已经有requests库,Beautiful Soup4库和csv库已经安装。


网页分析

我们要爬取的网页如下,我们需要的信息有房子的名称和价格

https://sh.lianjia.com/ershoufang/ 

如下图:


下面我们来分析我们所要提取的信息的位置,打开开发者模式查找元素,我们找到房子的名称和价格;如下图:


我们可以看到我们所需要的房子名称的信息在{div class="title"}里面,价格信息在{div class="totalPrice"}里面,所有的信息都封装在li标签里面。

我们分析了一个网页里面的网页结构,要爬取其他网页的信息还要看到更多的结构;

第一个网页链接:https://sh.lianjia.com/ershouf

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/知新_RL/article/detail/204342
推荐阅读
相关标签
  

闽ICP备14008679号