当前位置:   article > 正文

用python爬取二手房交易信息并进行分析_二手房源作为数据源,采用爬虫的方式对数据进行爬取,爬取信息包括行政区、房屋面积

二手房源作为数据源,采用爬虫的方式对数据进行爬取,爬取信息包括行政区、房屋面积

用python爬取二手房交易信息并分析

  1. 第一步:编写爬虫
    爬取某平台上海市十个区共900条二手房的交易信息
#爬取上海十个区的二手房价信息
import requests
from bs4 import BeautifulSoup
import csv

#获取房价的文本信息
def gethousetext(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "error"


# 获得房子的价格、面积、详细信息等
def gethouseinfo(h_list, html, loc):
    h_info = []
    soup = BeautifulSoup(html, "html.parser")
    house_info = soup.find_all('div', attrs={'class': "listX"})
    # 将房屋信息储存在一个列表里
    for h in house_info:
        p = h.find_all('p')
        h_info = [p[0].text, loc, p[2].text, p[3].text, p[4].text]
        h_list.append(h_info)


def storehouseinfo(h_list, fpath):
    # 打开csv文件,写入数据

    with open(fpath, 'w', encoding='utf-8') as f:
        house_csv = csv.writer(f, dialect='excel')
        house_csv.writerow(["基础信息","区域","访问情况","总价","单价"])
        for t in h_list:
            house_csv.writerow(t)


def main():
    place = ['pudongxinqu', 'minxingqu', 'xuhuiqu', 'putuoqu', 'baoshanqu', 'yangpuqu', 'hongkouqu'
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/192478
推荐阅读
相关标签
  

闽ICP备14008679号