当前位置:   article > 正文

2021SC@SDUSC 项目实训-算法介绍_2021sc@sdusc 搜狗workflow项目研究

2021sc@sdusc 搜狗workflow项目研究

2021SC@SDUSC


一、算法来源

Hsun-Ping Hsieh*, Shou-De Lin, Yu Zheng. Inferring Air Quality for Station Location Recommendation Based on Big Data. In the Proceeding of the 21th SIGKDD conference on Knowledge Discovery and Data Mining (KDD 2015).
在2021年《基于高阶图卷积网络的城市空气质量推断模型》一问中,针对此项任务提出了高阶图卷积神经网络的空气推断模型。然而此方法利用到了卷积和全连接网络,在复杂度和训练用时上比较难以接受,我们也不具备充足的计算资源,所以我使用的算法来自这篇论文中的对比算法,据作者介绍,AQInf是在其之前的最佳方法。

在这里插入图片描述
该论文试图回答两个问题。首先,如何在给定环境数据和来自非常稀疏的监测位置的历史空气质量数据的情况下推断任意位置的实时空气质量。第二,如果需要建立几个新的监测站来提高推理质量,如何确定最佳位置?这些问题具有挑战性,因为对于城市中的大多数位置 (>99%),我们没有任何空气质量数据来训练模型。所以我们利用现有监测数据和异构城市动态设计了一个半监督推理模型,包括气象、人类流动性、道路网络结构和兴趣点 (POI)。我们还提出了一个熵最小化模型来建议建立新监测站的最佳位置。

二、算法介绍

AQInf的主要工作在于提出了基于亲和函数进行区域连接的亲和图推理模型。
亲和函数和两节点之前的边值如下图所定义。亲和函数旨在描述两区域之间AQI概率分布的相关性。在这里插入图片描述
对于在全图中应该连接哪些边,文中给出了方案。分别是
1.都连接有监测站点的区域
2.就近连接
3.连接近段时间的区域(比如对Tn时间的X区域,可以连接Tn-1、Tn-2时的X区域)
4.连接相似的层(这个定义在论文中似乎不是很明确,如何分析两层的相似度也会是一个很有意思的问题,作者只是在这里提出比如某些现象24小时出现一次,找不到源代码我们只能这样来理解这个思路)
在这里插入图片描述
下图给出一个连接示例
在这里插入图片描述
根据这张亲和图我们可以构建出图的损失函数
在这里插入图片描述
但是这个函数无法直接优化。因为观察到的数据非常稀疏,因此这样做可能会使模型过度拟合验证数据。所以作者提出了一个学习目标

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/盐析白兔/article/detail/675829
推荐阅读
相关标签