赞
踩
真的好想出去玩啊!!!
春游啊这是!!!
万物复苏的好季节!!!
python 安装包+资料:点击此处跳转文末名片获取
requests
parsel
csv
pandas
pyecharts
python 3.6
pycharm
1. 确定目标需求
python采集旅游景点数据 / 去哪儿~
2. 发送请求
3. 获取数据
4. 解析数据
5. 保存数据
导入模块
import requests
import parsel
import csv
import time
写入表格
f = open('张家界景点.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['景区', '星级', '地区', '热度', '销量', '地址',
'价格', '简介', '详情页'])
csv_writer.writeheader()
多页采集
for page in range(1, 12):
print(f'===============================正在爬取第{
page}页数据内容=======================================')
time.sleep(2)
请求链接
url = f'https://*****.com/ticket/list_%E5%BC%A0%E5%AE%B6%E7%95%8C.html?from=mps_search_suggest_h&keyword=%E5%BC%A0%E5%AE%B6%E7%95%8C&page={
page}'
请求头:把python代码伪装成浏览器 给服务器发送请求
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.128 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
获取网页文本数据 response.text
# print(response.text)
解析数据
selector = parsel.Selector(response.text)
lis = selector
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。