赞
踩
这一部分讲解下面两种模型,获取entity和item的第一阶段(first-stage)的表示向量。
讲解本文使用的获取item在网络结构上表示向量的方法。采用类GAT的GNN方式。
讲解采用TransE模型获取节点(item,entity),边(relation)的初始特征。当然,relation的特征向量不重要。
这部分讲解如何利用图增强技术获取两个增强图(称为Views)
表示原来的图 。和表示两个增强图 。
是掩码矩阵。通过掩码矩阵和原始邻接矩阵的哈达玛积,得到增强图。
定义 i 节点的知识图结构一致性Ci。如果一个item的结构一致性得分较高,则它对拓扑信息的变化不太敏感。即Ci值越大,表明这个节点在网络上更加稳定,更不易受到图扰动的影响。反之亦然。Ci值的获取公式如上,fk函数表示的是1.1获取item节点特征的方式。
利用无监督的图对比学习获取节点向量。
这部分讲解本文两个增强图是怎么来的。
利用item的知识图结构一致性Ci来指导数据增强。结构一致性得分较高的item将涉及较少的噪音,并有助于用户真实兴趣的建模。item的Ci分数表征item对user的影响程度,具体用exp(Ci)度量。归一化成p’。 是为了缓解低价值效应。
表示 i和u之间的dropout概率。这个dropout概率和上面那个掩码矩阵(伯努利分布)共同决定两个增强图。pa,up都是超参。生成增强图的公式如下:
这部分讲,设置无监督的目标函数。
顺便讲解了上诉采用的图增强技术有区别于传统的图图技术SGL,GraphCL。通过从item语义和user行为模式的角度干扰图结构。
采用lightGCN作为两个增强图的encoder。
采用InfoNCE作为损失函数1。
另外损失函数2为Bayesian personalized ranking:
总损失函数为:
文章条例清晰,逻辑清楚。但是文章整体主题不够突出。文章用了很大一部分描述两个增强图的获取。与传统Augmentation不同的是,文章采用计算item的结构一致性Ci来设计网络边的dropout率。希望通过这种方式减少网络扰动对整体表示向量的影响。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。