赞
踩
today’s outline:
两种图增强的方法:
需要增强图的原因:
综上所述,输入图不是嵌入的最佳计算图 。
为什么我们需要特征增强?
第一种情况:
解决方法:
a)为节点分配常数特征
b)为节点分配唯一的ID,这些ID值可以被转换为独热向量
两种方法的比较:Constant vs. one-hot
第二种方法比第一种方法表达能力更强;第一种方法归纳能力更强,能够很容易地推广到新节点,第二种方法则不行;同时第一种方法的计算开销也更小;第一种方法适用于任意图,同时具有归约能力,能推广到新节点,第二种方法适用于小图,只适用于transductive setting,不适合inductive setting。
第二种情况:
解决方法:我们可以使用循环计数作为增强的节点特征
其他常用的增强特征有:
针对图稀疏:添加虚拟节点或边
针对图密集的问题:节点邻域采样
思想:在之前的设计中,所有节点参与消息传递,现在,我们**(随机)对节点的邻域进行采样以进行消息传递**,以解决图密集的问题。
例子:例如,我们可以随机选择 2 个邻居在给定层中传递消息
在下一层,当我们计算嵌入时,我们可以采样不同的邻居(对于类似于社交网络的图,也可以仅采样一些重要的节点,不必采样那些不重要的节点)
最后在预期中,我们得到类似于使用所有邻居的情况的嵌入。
这种方法的好处:可以大大降低计算成本,并且允许scaling to 大图,在实践中的效果也很好。
Learning so far:
**预测头(prediction head)**有以下几种类型:
不同的任务级别需要不同的预测头
1. 节点级预测:我们可以直接使用节点嵌入进行预测
2. 边级别预测:使用节点嵌入对进行预测
3. 图级别预测:使用图中的所有节点嵌入进行预测
那我们如何分层呢?
在回归问题上,我们使用 GNN 的标准评估指标,在实践中我们通常使用sklearn程序包来实现,假设我们对 N 个数据点进行预测
在图上评估回归任务,我们可以使用根均方差(RMSE) 和 平均绝对误差(MAE) 这两个指标来评价:
在图上评估分类任务:
对分类阈值敏感的指标
与分类阈值无关的指标
实现资源:
调试问题:损失/准确性在训练期间未收敛
对模型开发很重要的问题:
论文阅读:
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。