赞
踩
Mining tourist preferences and decision support via
tourism-oriented knowledge graph
目前,旅游管理研究的重点是通过对异构用户生成的内容进行广泛分析,来理解旅游偏好的波动,制定有针对性的发展策略。然而,鉴于在线景点评论涉及过多的混合和无形维度,广泛使用的无监督文本挖掘可能是不完整的或不准确的。此外,现有文献通常局限于几个旅游目的地和起源地的某些类型的景点,很难保证具有全面的洞察力。为了克服这些局限性,本研究提出了一种新的知识图谱驱动框架,该框架涉及旅游知识图谱(TKG)的系统构建和深入的研究与推理。遵循领域知识本体,从多源文本语料库中提取出11296716个多方面知识的结构化三联模型,提高了43.64%~50.65%的准确率,从中国340个旅游地中抽取了11174034名游客和20481个景点。利用TKG可以建立一个综合的决策支持系统,它分为符号查询和分布式推理两种不同的知识应用模式。在TKG上通过SPARQL查询实现多重时空分析,可以逐步发现旅游偏好、因果解释的分布规律及其对旅游地发展的影响。通过TKG注入丰富的上下文知识来细化对象的分布表示,可以显著增强下游推理任务,如旅游需求预测和旅游竞争情报。
对旅游偏好的清晰把握一直是旅游研究者和实践者关注的焦点。洞察游客的行为偏好有助于旅游营销组织完善现有景点,规划新景点,并提出有效的营销策略。旅游从业者可以进一步识别游客选择行为的潜在决定因素,并及时预测对景点的需求,或细分旅游市场,定制与旅游者特征相符的个性化套餐。然而,全面了解游客对景点的偏好一直是一个挑战,因为景点属于体验产品,具有有形、认知和情感特征维度的复杂多变的耦合。
分析旅游偏好和制定有针对性的策略通常利用人工调查的离散选择实验,如问卷或访谈。该方法适用于测量特定旅游场景的反馈或预测一个新产品的支付意愿,并测试潜在因素的假设。然而,在进行调查时,无可避免地存在抽样偏差和时间限制的挑战,这可能会限制研究范围和结果的概化性。幸运的是,随着信息和通信技术的快速发展,尤其有影响力的社交媒体平台,海量用户生成的内容被记录、存储和积累,形成了一种重要的大数据类型。这些内容公开、易收集、低成本、自发、充满热情和洞察力。在众多类型的UGC中,在线评论可以提供关于游客行为偏好的大量信息。因此,它被称为一个很有前途的替代数据源,以克服人工调查的局限性。在线评论的相关分析已成功地应用于各种旅游问题,如服务性能改进,旅游地形象感知、旅行日记分析、差异化营销,以及旅游需求预测。
尽管在文献中对在线评论的文本挖掘做出了许多努力,但在深入了解复杂的旅游者偏好以支持旅游规划决策方面仍然存在3个重要的研究空白。
1. 在线评论分析主要应用于酒店、餐厅以及航空部门,其目的是确定旅游体验的感知维度和满意度。然而,景点作为旅游地的关键吸引力,直到最近才通过在线评论挖掘进行了少量研究。2. 在方法论方面,流行的无监督文本挖掘算法已广泛应用于当前的酒店和餐饮研究,但在从景点评论中提取知识方面可能存在问题,甚至无效。不像酒店和餐厅有几个明确的属性,景点评论内容的主题异质性要广泛得多,以不同的动机和活动为特征,并结合了众多无形的特征。可以说,这些数据的这种特性可能会导致提取的主题过多、可分性差、歧义增加,从而降低主题识别的准确性。3. 大多数研究在描述性统计分析中停滞不前,比如局限于特定旅游者群体在特定时段对特定旅游地内少数类型旅游产品的偏好模式。因此,基于在线评论,对景点特征的旅游偏好的一般时空规律的见解很少,更不用说潜在的因果解释和对旅游地发展的潜在影响了。这是由于缺乏对大地理范围内的多个旅游地及起源地进行广泛的比较分析。因此,仍然需要解决一些问题,例如在有关景点的在线评论中充分发挥文本挖掘技术的潜力,以实现系统和全面地理解决策支持的旅游偏好。
为了填补上述空白,本研究提出了一个新的决策支持框架,系统地研究游客的偏好,基于知识图(KG)以及相应的查询技术和推理模型。KG作为一个基于图形的数据模型,通过充分的事实知识三元组,其节点表示感兴趣的实体,其边表示这些实体之间潜在的不同关系。KG的核心能力3点特征为旅游业的UGC挖掘和相关决策支持带来了前景。
与3个方面的利益相对应,KG的关键操作也可以分为3个过程:知识组织、获取和部署。知识组织是设计KG的本体,它形式化地表示领域专家的知识。知识获取是实例化根据本体从语料库中提取知识库中的信息。知识部署是利用KG实现多个下游决策支持任务的知识驱动解决方案。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。