赞
踩
livandata
数据EDTA创始人,没有之一
现担任数据EDTA个人公众号董事长兼CEO兼财务兼创作人
口号:让大数据赋能每一个人
前言
数据EDTA的读者们,大家好~
国庆将至大家有没有安排出行呢?
有没有翻遍了网站,为出行计划焦头烂额呢?
哈哈
不要着急~
今天,笔者与大家分享,身为一个python技术员是一件多么幸福的事情,因为:假期苦短,要用python~
笔者也是一个经常会为各种规划焦头烂额的人,出行一个礼拜,地点各不相同,一不小心就会多走几公里路,多花几个小时时间,那么,如何才能找到旅游地点之间的最短距离呢?
为了解决出行问题,笔者爬取了携程的热门酒店名称,然后调用高德地图的api,循环遍历找到了各个酒店的经纬度,而后根据酒店位置聚类定位景区的位置,再通过路径优化找到最便捷的出行顺序,如此,旅游可期了~
在这里笔者介绍一下为什么爬取热门酒店的位置?
如果要分析一个景区的热门程度,最好的方法是获取这个地方的人流量,即每个人的坐标以及活动轨迹,但是在平时的操作中,由于人是不停移动的,不仅很难获取对应的位置信息,而且涉及到个人隐私问题,我们无法进行单个人群的路径分析,退而求其次,我们选择分析热门的酒店情况,热门的景区周围总是伴随着大批酒店的,那么,我们可以根据酒店的数量间接的获取热门景区的位置,进而进行景区位置定位。
那么,我们的问题来了:
如何获取携程的酒店信息
笔者仔细分析了携程的网站信息,感谢携程对数据的宽容,携程的反爬手段并没有太严苛:
或许是我们获取数据太少的原因,我们只需要获取到携程某个地区的酒店名称即可,数据量不大,再加上所需字段较少,我们也就轻松的获取到了携程酒店名称。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。