赞
踩
使用Python来爬取二手房源数据,并保存表格,实现数据分析!
Python 3.8
Pycharm
模块
- # 数据请求模块 --> 第三方模块, 需要安装 pip install requests
- import requests
- # 解析数据模块 --> 第三方模块, 需要安装 pip install parsel
- import parsel
- # csv模块
- import csv
创建文件
- f = open('data.csv', mode='w', encoding='utf-8', newline='')
- csv_writer = csv.DictWriter(f, fieldnames=[
- '标题',
- '小区',
- '区域',
- '售价',
- '单价',
- '户型',
- '面积',
- '朝向',
- '装修',
- '楼层',
- '年份',
- '建筑类型',
- '详情页',
- ])
- csv_writer.writeheader()
发送请求, 模拟浏览器 对于 url地址 发送请求
模拟浏览器
- headers = {
- 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'
- }
请求网址/网站
url = 'https://cs.lianjia.com/ershoufang/'
发送请求
- response = requests.get(url=url, headers=headers)
- # <Response [200]> 响应对象 200 状态码 表示请求成功
- print(response)
获取数据, 获取网页源代码 <获取服务器返回响应数据>
解析数据, 提取我们想要的数据内容
解析方法:
re: 对于字符串数据直接进行解析提取
css: 根据标签属性提取数据内容
xpath: 根据标签节点提取数据内容
使用css: 根据标签属
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。