赞
踩
老外游中国
摘要
最近,“city 不 city”这一网络流行语在外国网红的推动下备受关注。随着我 国过境免签政策的落实,越来越多外国游客来到中国,通过网络平台展示他们在 华旅行的见闻,这不仅推动了中国旅游业的发展,更是在国际舞台上展现了一个 真实而生动的中国,一举多得。假设外国游客入境后能在中国境内逗留144小时,且能从任一城市附近的机场出境。由于每个城市景点较多,为了便于外国游客能够游览到更多的城市,现 假定“每个城市只选择一个评分最高的景点游玩”,称之为“城市最佳景点游览原则”。现在需要我们进行数据处理、统计分析、路径优化、多目标优化等多个数学建模技术,通过合理的数据处理和算法选择,为外国游客在中国的游览提供最佳的解决方案。
针对问题1,首先对数据进行预处理,由于我们是通过评分来计算城市和经典数量的,因此第一步将评分为空值和“--”的数据进行删除操作(由于爬虫爬不到数据,因此是空值)。在删除掉噪声数据之后,将所有的数据进行集成,从总体的csv文件当中提取景点评分字段和所在城市,计算33000个景点的最高评分BS,然后统计出获评BS的景点数量,并找到这些景点分布的城市,最后按照拥有BS景点数量排序,列出前10个城市并将结果可视化。
针对问题2,要求结合城市规模、环境环保、人文底蕴、交通便利,以及气候、美食等因素,对 352 个城市进行综合评价,并选出“最令外国游客向往的50个城市”。首先就是数据收集,由于附件数据没有问题2要求的指标,因此从各网站上爬取相关指标评分,然后对不同指标进行标准化处理,确保指标的可比性。接下来对数据进行标准化,采用AHP层次分析,再采用主成分分析与基于熵权法的TOPSIS综合评价,进行加权求和得到综合评分。最后根据综合评分进行排序,选出最令外国游客向往的50个城市。
针对问题3,要求在144小时以内游玩尽可能多的城市,同时要求综合游玩体验最好,规划游玩路线。首先根据最佳景点游览原则,从问题2中的50个城市中选择评分最高的城市进行游玩,且只选择高铁作为城市之间的交通方式,采用启发式算法,综合考虑总花费时间,门票和交通的总费用以及可以游玩 的景点数量。
针对问题4,要求在问题3的基础上,给出重新规划的游玩路线、最小化门票和交通的总费用,给出总花费时间以及可以游玩的城市数量。问题4将优化目标变成需要使门票和交通的总费用尽可能的少来解决。
针对问题5,要求选择入境的机场和城市,并个性化定制他的144小时旅游路线, 既要尽可能的游览更多的山,又需要使门票和交通的总费用尽可能的少。需要结合游客的要求给出具体的游玩路线,包括总花费时间,门票和交通的总费用以及可以游玩的景点数量。需要我们对数据进行重新整合,需要352个城市及其山景景点的详细数据集,包括景点名称、评分、建议游玩时间、门票价格、城市名称、经纬度等信息。
关键词:AHP,路径优化,多目标优化,熵权法,启发式算法,TOPSIS综合评价
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。