赞
踩
异构图表示学习的目的是为每个节点寻求一个有意义的向量表示,以方便后续应用,如链路预测、个性化推荐、节点分类等。然而,这个任务实现起来很困难。因为不仅需要将异构结构组成的多种类型的节点和边的信息整合,还需要考虑与每个节点相关联的异构属性、异构内容。尽管在同构图嵌入、属性图嵌入以及图神经网络等方面做了大量的工作,但很少有人能够有效地联合考虑异构结构(图)信息以及各节点的异构内容信息。本文提出了一种异构图神经网络模型HetGNN来解决这个问题。
异构图面临的挑战:
(C1)异构图中的许多节点可能不会连接到所有类型的邻居。此外,相邻节点的数量因节点而异。如何对与异构图中每个节点的嵌入生成紧密相关的异构邻居进行采样
(C2)在异构图中的一个节点可以携带非结构化的异构内容,此外,与不同类型的节点关联的内容也可能不同。如何设计节点内容编码器来解决HetG中不同节点的内容异构性
(C3)不同类型的邻居对异构图中节点嵌入的贡献不同。如何通过考虑不同节点类型的影响来聚合异构邻居的特征信息
异构图的表示学习:给定一个节点内容集C的C-HetG G = (V, E、OV、RE)。任务是设计一个带有参数Θ的模型FΘ去学习d维的嵌入,该嵌入能够编码异构结构关系和异构的非结构化的内容。节点嵌入可用于各种图数据挖掘任务,如链接预测、推荐、多标签分类、节点聚类等。
HetGNND:
HetGNN由四部分组成:(1)采样异构邻居;(2)编码节点异构内容;(3)聚集异构邻居;(4)制定目标,设计模型培训流程。图2说明了HetGNN的框架。
大多数图神经网络(GNNs)的关键思想是聚合来自节点的直接(一阶)邻居的特征信息。然而,直接将这些方法应用于异构图可能会引起以下几个问题:
针对这些问题,设计了一种基于重启随机游走的异构邻居采样策略:
步骤1:采样固定长度RWR。从节点v∈V开始随机漫步。该步以迭代的方式移动到当前节点的邻居,或者以概率p返回到起始节点。RWR一直运行,直到成功收集到固定数量的节点,记作RWR(v)。其中RWR(v)中不同类型节点的数量受到限制,以确保v中所有节点类型都被采样。
步骤2:将不同类型的邻居分组。对于每个节点类型t,根据频率从RWR(v)中选择顶部的kt节点,作为节点v的t型相关邻居集合。
该策略能够避免上述问题,因为:(1)RWR为每个节点收集所有类型的邻居;(2)固定每个节点的采样邻居大小,选择访问频率最高的邻居;(3)将相同类型的邻居(具有相同的内容特性)进行分组,以便部署基于类型的聚合。
由于文章在服务器上,全文内容详见:http://bbit.vip/service/main.php?version=1&type=article&id=12
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。